Comment ce modèle fonctionne

Un labo, une expérience de dataviz en grandeur nature pendant 38 jours. Chaque prono est horodaté et figé avant le coup d'envoi — pas de réécriture de l'histoire.

Le modèle expliqué

1. Rating Elo

Chaque équipe a un rating qui augmente après une victoire (pondérée par l'écart de buts) et diminue après une défaite. Le K-factor est à 40 pour cette courte compétition — on veut réagir vite. Seed initial calibré sur eloratings.net.

2. Avantage pays hôte

Mexique, États-Unis et Canada reçoivent un bonus de +50 Elo pendant la phase de groupes. C'est l'effet terrain : objectivement mesurable dans l'histoire du football.

3. Probabilité de nul

En phase de groupes, on calcule la proba de nul comme 0.29 × e^(-|écart Elo|/650). Plus l'écart grandit, moins le nul est probable. Cette fonction a été calibrée sur l'historique des Coupes du Monde.

4. Score probable

On estime ~2.7 buts attendus par match (xG), qu'on répartit selon le rapport de force (l'équipe favorite en reçoit plus). Puis on arrondit cohérent avec l'issue prédite (pas de 3-3 si on prédit une victoire).

Les sources

Calendrier et résultats : openfootball/worldcup.json (domaine public, sans clé API).

Rating Elo initial : eloratings.net (estimation basée sur les matchs précédents).

Code : Public sur GitHub — le modèle est là, expliqué ligne par ligne.

Pourquoi transparent ?

"Transparent" ne signifie pas "parfait". Ça signifie : chaque prono est horodaté et figé avant le coup d'envoi. Pas de modification après coup. Le compteur dit la vérité. Et si le modèle se trompe, on voit exactement pourquoi (Elo mal calibré ? Facteur oublié ? C'est débuggable).

C'est exactement ce que j'enseigne dans mon livre : la donnée n'a de valeur que si on peut la questionner.

← Retour aux pronos du jour