Blogo Economicus

Accueil » Petits exercices économétriques » Econométrie du Top 14

Econométrie du Top 14

Rédigé par Simon
     Cette fois ça y est. J’en parle depuis longtemps, mais faute de temps je n’ai jamais pu exploiter les quelques données disponibles sur les matchs de rugby, du top 14 ou autres. Pourtant les sujets sont nombreux : quel est l’impact de l’introduction des systèmes de bonus offensifs/defensifs sur le nombre d’essais marqués ? dans les championnats « transnationaux » (par exemple la Rabodirect pro12 qui réunit les meilleures équipes galloises, écossaises, irlandaises et italiennes), quel est l’impact de la nationalité de l’arbitre sur le résultat du match ? quelle est l’influence du public sur les décisions arbitrales ? Avec des données assez précises on peut se faire une idée sur ces questions.
     Aujourd’hui, je m’intéresserai à l’avantage de jouer à domicile. Le top 14 cette année le montre bien, avec la difficulté que connaissent les meilleures équipes pour s’imposer à l’extérieur.

     Par manque de temps, les données dont je dispose sont bien évidemment limitées. J’ai recueilli ce que j’ai pu sur la saison 2011-2012 du Top 14, j’espère pouvoir faire les années qui suivent plus tard. Pour cette année, j’ai relevé le score et le nombre d’essais inscrit, ainsi que la fréquentation relative (fréquentation pour le match sur la fréquentation moyenne tout au long de l’année).
     On peut également créer une variable valant 1 en cas de victoire, 0 sinon. Même chose pour la variable « domicile ». Enfin, on peut construire une variable « différence de niveau » entre les équipes, en calculant la différence au classement en fin de saison entre l’équipe 1 et l’équipe 2. Ainsi, on « contrôle » la différence de niveau entre les équipes pour chaque match.
     Par exemple, Toulouse termine premier en fin de saison, et Brive treizième, la variable « différence classement » est égale à 12 pour le match entre Brive et Toulouse. De plus, ces données sont des données de panel (on observe un meme « individu », une équipe, pendant plusieurs périodes), et on peut alors  introduire des « fixed effects » pour contrôler les caractéristiques non-observables de chaque équipe.
     A partir de ces données (encore une fois très limitées, mais le but ici est plus de faire une analyse statistique avec un minimum de précaution et de rigueur), j’ai construit cinq modèles :
(1) le premier estime la probabilité de victoire (modèle logit) en fonction de la différence de niveau, du fait de jouer à domicile ou non
(2) le second modèle est identique au premier, mais je ne regarde que les matchs avec une différence absolue de classement inférieure à trois (ça permet de regarder uniquement les matchs entre équipes de niveau proche)
(3) le troisième modèle est identique mais utilise la méthode des fixed effetcs
(4) ce modèle regarde uniquement les matchs à l’extérieur. J’introduis donc la distance en kilomètre entre les villes pour voir si cela a un effet, ainsi que la fréquentation (spectateurs)
(5) modèle complètement différent : comment expliquer la fréquence relative (fréquence / fréquence moyenne tout au long de la saison) ? J’essaie de voir si la différence classement attire les gens (si on reçoit une grosse équipe, se déplace-t-on au stade ?), et si les performances récentes de l’équipe contribue à attirer les spectateurs (victoire ou non dans les deux matchs précédents, bonus défensif ou non dans les deux derniers matchs)
     Les résultats sont résumés dans le tableau ci dessous :
 Table - rugbyreg
     Chaque colonne correspond à un modèle. Les étoiles indiquent un impact significatif (0 étoile signifie que l’effet n’est pas significatif).
     Dans les trois premiers modèles, l’estimation permet d’obtenir des « odds ratio » ou rapport de chances relatives. Exemple : le fait de jouer à domicile multiplie par 9 (!) la probabilité de gagner relativement à la probabilité de perdre, dans les trois premiers modèles. L’effet est donc très important, notamment au regard de l’effet de la différence de niveau : une place d’écart de plus par rapport à l’équipe adverse diminue la probabilité de gagner relativement à la probabilité de perdre.
     Dans le quatrième modèle, la distance n’est pas associé à une moindre chance victoire pour l’équipe qui se déplace (c’est parfois une raison avancée pour expliquer l’avantage à domicile : le voyage de l’équipe qui joue à l’extérieur est fatiguant). De même, le nombre de spectateur ne diminue pas la chance de l’emporter à l’extérieur
     Enfin le dernier modèle tente d’explorer le lien entre la fréquentation relative pour un match donné et le résultat de ce match et les résultats passés de l’équipe qui joue à domicile. Bien sûr, les résultats sont biaisés ici, puisque l’anticipation d’une victoire peut influencer la fréquentation (c’est cet effet que je regarde), mais la fréquentation peut influencer en retour le résultat du match. Mais bon, si on ne peut pas conclure à des relations causales ici, on peut toujours regarder les corrélations. La variable victoire n’a pas d’impact significatif : peut être est-ce du aux insuffisances du modèle, ou alors les gens évaluent mal la probabilité de victoire (si tant est qu’ils sont plus enclins à aller à un match où il anticipe la victoire de leur équipe), ou alors ils se fichent complètement du résultat futur du match. Cette dernière hypothèse est à mon avis fausse, puisqu’il est intéressant de noter que, même si les victoires passées (L.victoire et L2.victoire) de l’équipe qui reçoit n’a pas d’impact sur la fréquentation, en revanche les points de bonus offensifs (L2.bo) passés (en T-2) ont eux un impact. Autrement dit, quand l’équipe qui reçoit a inscrit pas mal d’essais dans les matchs récemment disputés, alors la fréquentation s’accroit. Enfin, il semblerait que les spectateurs se déplacent davantage pour la réception des grosses équipes : le coefficient devant la variable « différence classement » (la différence au classement final) est en effet positif.
     Voilà pour ce petit modèle sur le rugby. Il y a bien sûr des insuffisances, mais ça correspond à ce qui se fait généralement en économétrie du sport où il assez difficile (ça dépend des sports cependant) d’obtenir des statistiques détaillées. Par exemple, il aurait été intéressant ici d’avoir le nombre de pénalités au cours d’un match (c’est là dessus que les arbitres peuvent être influencés). Mais bon, impossible malheureusement d’y passer des heures !

Un commentaire

  1. Bonjour, étant moi même en Master II Économiste d’Entreprise, je suis tombé sur cet article par hasard, et je le trouve extrêmement intéressant. Étant également passionné par le sport, je rêve un jour de pouvoir réaliser des statistiques de la sorte et d’en faire mon métier.
    Bravo pour cet article, je le recommanderai aux gens qui ont la même passion que moi.
    Cordialement.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

%d blogueurs aiment cette page :