Produit par Big Data Digest
Auteur : Caleb
Le calendrier de la Coupe du monde est arrivé le 11ème jour.
Je crois que les supporters argentins transpiraient hier soir. Bien que l'Argentine ait été assiégée tout au long du match et ait réalisé un total de 23 tirs, ils ont raté trop d'occasions, y compris le penalty de Messi. Heureusement, l'offensive a été très rapide en seconde période. Après avoir marqué 1 but lors du match d'ouverture, ils ont poursuivi la victoire et ont finalement battu l'équipe polonaise 2-0.
Ce match a également permis à Messi de surpasser Maradona et de devenir le joueur avec le plus d'apparitions en Coupe du monde dans l'histoire de l'Argentine.
La surprise s'est poursuivie en phase de groupes. Au tour final du groupe D, l'équipe tunisienne a battu l'équipe de France, qui avait débuté avec une formation non principale, 1:0, mais s'est classée troisième du groupe et a raté le groupe de qualification. L'équipe de France s'est hissée dans le top 16. le chef de groupe.
Bien que la Coupe du monde ne soit pas encore à mi-parcours, les pronostics sur le vainqueur de cette Coupe du monde ont commencé tôt.
Est-ce que ce sera l'équipe traditionnelle forte du Brésil et de la France ? Ou y a-t-il un cheval noir qui émerge ?
Douze ans après la retraite glorieuse d'Octopus Paul, Squidward ne s'attendait peut-être pas à ce que son rôle soit hérité par l'IA.
Jetons un coup d'œil à la manière dont l'IA prédit le vainqueur de cette Coupe du monde~
Trois chercheurs de l'Institut Alan Turing (The Alan Turing Institute), Nick Barlow, Jack Roberts et Ryan Chan, ont développé une étude statistique modèle.
Ce modèle statistique est basé sur un modèle dérivé de "Premier League Fantasy" en 2018, AIrsenal, qui à son tour s'appuie sur le modèle classique de prédiction du football lancé par Dixon et Coles en 1997.
Le modèle classique part principalement de la force offensive, de la force défensive et de l'avantage du terrain de l'équipe, et utilise les statistiques bayésiennes pour calculer l'équipe la plus susceptible de marquer et de gagner dans le match.
Afin de rendre AIrsenal plus utile pour prédire les résultats des compétitions internationales, les chercheurs ont introduit les paramètres de force relative des différents continents.
De plus, les chercheurs ont également utilisé une base de données plus complète lors de la formation du modèle.
Une base de données compilée par l'utilisateur de GitHub martj42 enregistre les résultats détaillés de chaque match de football depuis 1872. Les données différencient et trie également le poids des matchs. Par exemple, les matchs principaux de la Coupe du monde (après 2002) et les matchs récents sont séquentiellement plus importants que les championnats intercontinentaux, les éliminatoires et les matchs amicaux.
Lien GitHub : https://github.com/martj42/international_results
Les chercheurs intègrent également les classements officiels de la FIFA dans le modèle pour fournir les dernières estimations des performances des équipes.
Après 100 000 simulations, l'IA a également donné ses propres prédictions.
Sans surprise, le Brésil a toujours été le favori, se classant premier de cette Coupe du monde sur 25 000 pronostics, avec un taux de victoire de 25 %.
Suivi des équipes traditionnelles fortes, la Belgique et l'Argentine, les taux de victoire ont atteint 18% et 13,5%.
Si vous pensez que parler de finale et de championnat est un peu trop loin maintenant, jetons un coup d'œil aux pronostics des résultats des matchs récents.
En ce qui concerne le match entre l'Angleterre et le Pays de Galles du 29 novembre, les résultats de l'IA indiquent que l'Angleterre a environ 80 % de chances de se qualifier dès la phase de groupes et 60 % de chances d'accéder aux quarts de finale ou à la finale. la probabilité de remporter le championnat n'est que de 7 %.
En regardant le Pays de Galles, l'équipe galloise a une probabilité de 50 % de se qualifier pour la phase de groupes, mais la probabilité d'accéder à la finale n'est que de 2 % et la probabilité de remporter le championnat n'est que de 0,5 %.
À en juger par la performance actuelle de cette Coupe du Monde, l'Angleterre compte 1 victoire, 1 nul et 4 points, se classant temporairement première du groupe. Après avoir facilement battu l'Iran 6-2 au premier tour, leur performance contre les États-Unis au deuxième tour a été médiocre. D'une manière générale, après deux tours de matchs, l'Angleterre se porte encore relativement bien et l'effort physique n'est pas très élevé, mais le problème est que la composition de l'équipe n'a pas encore fait face à un véritable défi. Lors du dernier match de groupe avant les huitièmes de finale, l'Angleterre a définitivement besoin de plus d'énergie pour affronter le match. Bien que la force globale du Pays de Galles soit dominée par Bale et Ramsey, la force des autres n'est évidemment pas aussi bonne qu'avant en raison de l'âge et des blessures.
Dans le même temps, à en juger par les résultats historiques des deux équipes s'affrontant 103 fois, l'Angleterre a un avantage absolu avec 68 victoires, 21 nuls et 14 défaites.
À en juger par le résultat final, l'Angleterre a terminé la phase de groupes avec une victoire 3-0. Dans le même temps, elle s'est également classée première du groupe B avec un bilan de 2 victoires et 1 nul, et s'est qualifiée avec l'équipe des États-Unis. , qui a enregistré 1 victoire et 2 nuls.
En plus du modèle de l'Institut Alan Turing, il existe de nombreux modèles de prédiction qui ont donné leurs propres prédictions pour cette Coupe du Monde.
Par exemple, le blogueur @JackCuiAI a collecté des statistiques sur les données des matchs de football internationaux de 1872 à 2022 et les données du classement mondial de la FIFA de 1922 à 2022, a analysé ces données et extrait les facteurs qui affectent le jeu, y compris les classements, après des caractéristiques clés telles que la maison. et les matchs à l'extérieur, le nombre de tirs, le nombre d'arrêts et le score final, le gradient boosting classifier est utilisé pour donner ses propres prédictions à l'aide de l'arbre de décision intégré d'apprentissage du gradient boosting.
Lors des quatre premiers matches de Qatar-Équateur, Angleterre-Iran, Pays-Bas-Sénégal et Pays de Galles-États-Unis, l'IA a donné des prédictions tout à fait cohérentes avec les résultats réels, y compris même les scores et les points de la phase de groupes. de chaque équipe.
Selon les prédictions de l'IA, le top 8 de cette Coupe du monde sera les Pays-Bas, l'Argentine, l'Espagne, le Brésil, l'Angleterre, la France, la Belgique et le Portugal. La finale se déroulera entre le Brésil et le Portugal, et à la fin le Brésil gagnera. la première place dans l'histoire de l'équipe. Six trophées de la Coupe du monde.
Il semblerait que l'équipe brésilienne soit effectivement très appréciée de l'IA.
Une équipe de recherche commune de la TU Dortmund, de l'Université technique de Munich, de l'Université du Luxembourg et d'autres universités a également combiné plusieurs modèles statistiques représentant la force de l'équipe avec la structure de l'équipe (valeur marchande ou nombre de joueurs de la Ligue des champions) et les facteurs socio-économiques du pays d'origine. (population ou produit intérieur brut) et d'autres informations, donnant des pronostics pour la Coupe du monde.
Le Brésil est en tête de liste avec un taux de victoire de 15 % et une probabilité de 23,5 % d'accéder à la finale ; l'Argentine est suivie de près avec une probabilité de victoire de 11,2 % ; la troisième équipe la plus populaire est les Pays-Bas, avec un taux de victoire de 9,7 % ; L'Allemagne et la France sont classées quatrième et cinquième.
La précision des prédictions précédentes faites par l'équipe de recherche est assez élevée, comme les champions de la Coupe d'Europe en 2008 et 2012, le champion de la Coupe du monde en 2010, etc.
Mais Grohl, professeur de statistiques à l'Université technique de Dortmund, a également déclaré qu'il pouvait y avoir des erreurs dans les pronostics, sinon le match de football deviendrait très ennuyeux.
"Ce que nous fournissons n'est que des probabilités, pas des certitudes. 15 % de probabilité de gagner signifie également 85 % de probabilité d'échec."
Oui, l'incertitude sur le terrain est la plus attrayante, vous avez raison. Allez Messi.
Rapports associés : https://www.turing.ac.uk/blog/can-our-algorithm-predict-winner-2022-football-world-cup
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!