Contexte: un de mes amis se fait un passe-temps (comme jimagine que beaucoup le font) dessayer de prédire les résultats des séries éliminatoires de hockey. Il essaie de deviner léquipe gagnante à chaque match et le nombre de matchs nécessaires pour gagner (pour quiconque ne connaît pas le hockey de la LNH, une série est décidée par un meilleur de 7). Son bilan cette année après 3 tours de jeu (8 + 4 + 2 = 14 meilleurs des 7 matchs) est 7 correct / 7 incorrect pour léquipe gagnante et 4 correct / 10 incorrect pour le nombre de matchs (il considère uniquement le nombre de matchs correct sil a également choisi léquipe gagnante).
Nous sommes arrivés à plaisanter en disant quil ne fait pas mieux que de deviner à laveugle sur la question des équipes, mais quil bat considérablement les chances si lon suppose que les probabilités pour une série de 4, 5, 6 ou 7 jeux sont égaux (attendez-vous à un taux de réussite de 12,5%, il est à 28,5%).
Cela nous a amenés à nous demander quelles sont réellement les chances pour chaque nombre possible de jeux. Je pense que je « ai travaillé, mais je veux attacher quelques détails car une partie de mon approche était de gribouiller par force brute sur un grand morceau de papier. Mon hypothèse de base est que le résultat de chaque partie est aléatoire avec une probabilité $ \ frac {1} {2} $ pour que chaque équipe gagne.
Ma conclusion est que:
$$ \ rm P (4 \; jeux) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; jeux) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; jeux) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; jeux) = \ frac {40} {2 ^ 7} = 31,25 \% $$
Jai guidé mon analyse en me basant sur lidée quune série de 4 jeux devrait avoir une probabilité de $ \ frac {2} {2 ^ 4} $, analogue aux chances de lancer 4 pièces et dobtenir soit 4 têtes ou 4 queues. Les dénominateurs étaient assez faciles à comprendre à partir de là. Jai obtenu les numérateurs en comptant le nombre de combinaisons « légales » (WWLWWLL serait illégal puisque la série serait décidée après 5 matchs, les 2 derniers matchs ne seraient pas joués) de résultats pour un nombre de jeux donné:
Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL
Quelle est « une méthode sans force brute pour dériver les numérateurs? Je pense quil peut y avoir une définition récursive, pour que $ \ rm P (5 \; games) $ puisse être défini en termes de $ \ rm P (4 \; games) $ et ainsi de suite, et / ou quil peut impliquer des combinaisons comme $ \ rm (probabilité \; de \; au \; moins \; 4/7 \; W) \ fois (probabilité \; de \; légal \; combinaison \; de \; 7 \ ; résultats) $, mais je suis un peu coincé. Au départ, jai pensé à quelques idées impliquant $ \ left (^ n_k \ right) $ mais il semble que cela ne fonctionne que si lordre des résultats na pas dimportance.
Fait intéressant, un autre ami commun a sorti des statistiques sur 7 séries de matchs joués (NHL, NBA, MLB 1905-2013, 1220 series) et a proposé:
4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73%
Cest en fait un assez bon match (du moins du point de vue de mon astronome!). Je suppose que lécart vient du résultat de chaque match ayant été biaisé en faveur dune victoire pour une équipe ou pour lautre (en effet, les équipes sont généralement classées au premier tour de sorte que léquipe de qualification en tête joue léquipe à peine qualifiée, la deuxième place joue lavant-dernier, et ainsi de suite … et la plupart des jeux sont au premier tour).
Commentaires
- Je ne suis pas particulièrement actif sur CV.SE, cela peut donc nécessiter un peu de recalage.
Réponse
Pour un équipe pour gagner [la série] dans le jeu N, ils doivent avoir remporté exactement 3 des premiers matchs N-1. Pour le septième jeu, il existe $ \ binom {6} {3} = 20 $ moyens de le faire. Il existe 2 résultats possibles pour le septième match et 20 combinaisons possibles de victoires pour chacune des équipes qui peuvent gagner, soit 40 résultats possibles. Pour une série de N-jeux , une série au meilleur des sept se termine par N jeux, le nombre de possibilités est $ 2 \ binom {N-1} {3} $.
En effet, lordre na pas dimportance, je Si vous êtes déjà informé du nombre de parties jouées. Seul le dernier jeu compte, et le gagnant doit avoir 3 victoires précédentes, dans nimporte quel ordre.
Commentaires
- Pour une série de jeux N, ' Est-ce que ce sera $ 2 (^ {N-1} _ {{\ rm floor} (N / 2)}) $, ou quelque chose comme ça? En supposant quil y ait un nombre impair de parties, ce nest que raisonnable.
- Jutilisais N comme nombre de parties jouées dans un best-of-sept. Par exemple. pour N = 4, $ 2 \ binom {3} {3} = 2 $ vous donne le nombre de façons possibles de terminer la série en 4 parties. cest à dire. pour chaque équipe, le nombre de façons de choisir 3 victoires sur 3 matchs.
- Oui, les possibilités d’une série M-game décidées en N matchs devraient être de 2 $ \ binom {N-1} { \ mathrm {étage} (M / 2)} $. Cela fonctionnera toujours sil y a ' un nombre pair de jeux, si les séries à égalité ne sont pas considérées comme décidées.
- Si vous voulez être réaliste, la probabilité de la victoire ne doit pas être de 0,5 pour chaque équipe pour chaque match. Il pourrait y avoir un avantage de la glace à domicile comme exemple.
- @MichaelChernick vrai, et jen parle un peu dans le dernier paragraphe de la question, mais 0,5 comme point de départ qui peut être ajusté plus tard est raisonnable .
Réponse
Une autre façon de regarder serait la distribution binomiale: vous avez besoin de x = 3 (exactement 3 succès) en n = 6 (traîne), donc si la probabilité de gagner une partie est de 0,5 (les deux équipes se ressemblent également), le binôme dirait P (x = 3) = 6C3 * (.5) ^ 3 * (.6 ) ^ 3 = .3125 Cela signifierait quil y a 31,25% de chances daller à 7 séries de jeux. Et la probabilité que vous gagnez dans le 7 e match, suivrait un binôme négatif, combien de traînées = 7 pour 4 succès, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4