La banque Goldman Sachs a fait tourné ses modèles économétriques sur ses ordinateurs. Le verdict : la France va gagner la compétition avec une probabilité de 23 % devant l’Allemagne (20 %) qui contrairement à l’adage à la fin c’est l’Allemagne qui gagne, l’Espagne (14%) et l’Angleterre (11%). Si l’Allemagne a le meilleur score Elo, la France l’emporte grâce à l’avantage de jouer à domicile. La banque mettra à jour ses modèles au vu des résultats des matches.
Comment fonctionne le modèle de Goldman Sachs ?
Premièrement, la banque bâtit un modèle de régression pour prédire le nombre de buts marqués par une équipe en particulier (équipe A) contre un particulier adversaire (équipe B) à partir de toute l’histoire des matches internationaux obligatoires depuis 1958, lorsque le premier championnat d’Europe a été joué (un total de 4719 matchs). Suite à la littérature sur la prévision des matchs de football, le modèle suppose que le nombre de buts marqués par l’équipe A est décrite par une distribution dite Poisson et expliquée par les facteurs statistiques suivants :
1. La différence de performance de l’équipe comme en témoigne le classement Elo avant chaque match. Le système Elo a été initialement conçu pour classer les joueurs d’échecs. Il est une mesure composite de succès de l’équipe nationale de football qui évolue en fonction des résultats d’une équipe et la force de ses adversaires.
2. Le nombre de buts marqués par l’équipe i dans les 10 derniers matches de compétition.
3. Le nombre de buts encaissés par l’équipe j dans les 2 derniers matches de compétition.
4. Un tournoi fictif
5. Un Championnat d’Europe fictif pour mesurer si une équipe fait systématiquement mieux aux Championnats d’Europe que dans les autres matches de compétition
Deuxièmement, le modèle utilise ces estimations de régression et de la distribution de Poisson supposé dans une simulation de Monte Carlo avec 100.000 tirages pour générer une distribution des résultats pour chacun des 51 matches, de l’ouverture entre la France et la Roumanie le 10 Juin à la finale le 10 Juillet. .
Troisièmement, le programme utilise les résultats d’estimation pour générer à la fois un ensemble de probabilités pour une équipe d’atteindre un stade particulier du tournoi.