Description et discussion des méthodes utilisées.

Voir les prévisions en cours pour la Ligue 1 et pour la Ligue 2.

Prévisions sur championnat de football

Principes

On démarre avec la situation actuelle du championnat puis on termine le championnat en choisissant au hasard les résultats des matches restants. On obtient donc un classement final sur lequel on peut observer qui est champion, qui est relégué, quelle équipe est devant l'autre, etc.

Naturellement, ce classement final est biaisé par les résultats des matches tirés au sort. L'idée est alors de recommencer un grand nombre de fois (un million en l'occurrence) pour obtenir toutes les fins de championnat possibles.

Ainsi, sur le million de fins de championnats générés, on va compter combien de fois chaque équipe a terminé première, combien de fois elle a été reléguée, etc. Ce sont ces pourcentages qui apparaissent sur les différentes pages du site.

Statistiques sur les fins de matches

Pour choisir au hasard le résultat d'un match, on respecte la répartition observée lors des dernières saison et fournie ci-dessous.

  • Statistiques sur la conclusion des matches :
    Victoires à domicile47.06 %
    Matches nuls29.30 %
    Victoires à l'extérieur23.63 %
  • Scores les plus fréquents en fin de match :
     Scores  Fréquences 
    1 - 113.33 %
    1 - 013.23 %
    0 - 011.02 %
    2 - 09.73 %
    2 - 18.29 %
    0 - 17.96 %
    1 - 25.50 %

Discussion (section ajoutée le 14 mars 2005)

La première motivation de ces pages sur le championnat de football est purement personnelle : elles doivent me donner l'intuition du devenir de mon équipe préférée sachant que je n'ai pas le temps de suivre le championnat et que je ne veux pas attendre la certitude mathématique du titre ou de la relégation, certitude qui le plus souvent ne survient que le dernier jour du championnat. Il est probable que ceux qui suivent de près le championnat ont déjà ce type d'intuition et n'ont donc rien à apprendre sur ce site.

L'intuition recherchée est donnée par les probabilités estimées par la méthode. Il n'y a pas réellement de prédiction et donc pas de raison de dire a posteriori que la méthode a fonctionné ou s'est trompée : on donne des probabilités, on ne dit pas que c'est l'événement le plus probable qui va se produire. En voici un exemple typique :

Saison 2001-2002

À six journées de la fin du championnat, la méthode donnait Lens champion à 81.82 %, le plus sérieux concurrent étant Lyon avec 14.14 %.

Pendant les six dernières journées, Lens ne gagne qu'un seul match tandis que Lyon en gagne quatre, dont deux à l'extérieur. Au final, Lyon est champion et Lens second à deux points (il aurait donc suffit une victoire supplémentaire pour que Lens remporte le titre).

En résumé, l'évaluation à six journées de la fin semble correcte : il était plus probable que Lens soit champion plutôt que Lyon. Mais c'est l'événement moins probable (le couronnement de Lyon) qui s'est produit. Notez que celui-ci était tout de même donné avec une chance sur sept, ce qui est loin d'en faire un événement improbable.

Le seul point qui peut faire l'objet de discussion est le mode d'évaluation des probabilités : étant donnée une rencontre, quel est la probabilité de chaque score ? La méthode décrite ci-dessus ne prend en compte que les statistiques sur les scores observés durant les championnats précédents. On pourrait imaginer faire intervenir d'autres éléments : réussite des équipes à l'extérieur et à domicile, forme ou blessure des joueurs, classement actuel, participation et réussite dans les autres épreuves, etc. Comment le faire ? Je ne sais pas. Et je manque de temps pour chercher mais je suis preneur si vous avez des idées.

J'ai cependant été en partie conforté dans l'idée de tirer le score des rencontres au hasard par la lecture d'un article de John Wesson : La glorieuse incertitude du football, paru dans la revue Pour la Science (numéro 301 de novembre 2002). Il y est expliqué qu'un score courant comme 0-0 ou 1-0 doit souvent un peu au hasard : un 0-0 n'indique pas que les deux équipes sont exactement de même force et le 1-0 ne signifie pas toujours que l'équipe gagnante était la meilleure. Pourtant, ce dernier score amène trois points à l'équipe gagnante, si bien qu'à la fin du championnat le classement peut être considéré comme aléatoire (comme les classements que ma méthode calcule).

Nombre de points

Avril 2008. Ajout pour chaque équipe du nombre de points pour être champion, européen, pour éviter la relégation, etc.

Simulations avec des équipes exclues

En mai 2009, Michel Boulier m'a suggéré, merci à lui, de calculer un classement basé sur les matches réels mais en excluant certaines équipes. Son idée était de savoir ce que serait le classement final si les plus gros budgets (PLMB) n'était pas présents.

Cette page vous permet de mener de telles simulations, en voici quelques résultats pour la saison 2008-2009 :

Si vous obtenez d'autres classements remarquables, dites-le moi.