Un labo, une expérience de dataviz en grandeur nature pendant 38 jours. Chaque prono est horodaté et figé avant le coup d'envoi — pas de réécriture de l'histoire.
Chaque équipe a un rating qui augmente après une victoire (pondérée par l'écart de buts) et diminue après une défaite. Le K-factor est à 40 pour cette courte compétition — on veut réagir vite. Seed initial calibré sur eloratings.net.
Mexique, États-Unis et Canada reçoivent un bonus de +50 Elo pendant la phase de groupes. C'est l'effet terrain : objectivement mesurable dans l'histoire du football.
En phase de groupes, on calcule la proba de nul comme 0.29 × e^(-|écart Elo|/650). Plus l'écart grandit, moins le nul est probable. Cette fonction a été calibrée sur l'historique des Coupes du Monde.
On estime ~2.7 buts attendus par match (xG), qu'on répartit selon le rapport de force (l'équipe favorite en reçoit plus). Puis on arrondit cohérent avec l'issue prédite (pas de 3-3 si on prédit une victoire).
Calendrier et résultats : openfootball/worldcup.json (domaine public, sans clé API).
Rating Elo initial : eloratings.net (estimation basée sur les matchs précédents).
Code : Public sur GitHub — le modèle est là, expliqué ligne par ligne.
"Transparent" ne signifie pas "parfait". Ça signifie : chaque prono est horodaté et figé avant le coup d'envoi. Pas de modification après coup. Le compteur dit la vérité. Et si le modèle se trompe, on voit exactement pourquoi (Elo mal calibré ? Facteur oublié ? C'est débuggable).
C'est exactement ce que j'enseigne dans mon livre : la donnée n'a de valeur que si on peut la questionner.