Statistieken van 7 series playoffs

Achtergrond: een vriend van mij maakt een hobby (zoals ik me kan voorstellen dat velen dat doen) om te proberen de uitkomsten van hockey playoffs te voorspellen. Hij probeert het winnende team in elke matchup te raden, en het aantal games dat nodig is om te winnen (voor iedereen die niet bekend is met NHL hockey wordt een serie bepaald door een beste van 7). Zijn record dit jaar na 3 speelrondes (8 + 4 + 2 = 14 best of 7 matchups) is 7 correct / 7 incorrect voor het winnende team en 4 correct / 10 incorrect voor het aantal games (hij beschouwt alleen het aantal games correct) als hij ook het winnende team koos).

We maken een grapje dat hij het niet beter doet dan blind te raden op de teamvraag, maar dat hij de kansen aanzienlijk verslaat als men aanneemt dat de kansen voor een 4, 5, 6 of 7 game series zijn gelijk (zou een succespercentage van 12,5% verwachten, hij is 28,5%).

Hierdoor vroegen we ons af wat de kansen eigenlijk zijn voor elk mogelijk getal van games. Ik denk dat ik het uitgewerkt heb, maar ik wil een paar losse eindjes aan elkaar knopen, aangezien een deel van mijn aanpak bestond uit brute kracht krabbelen op een groot stuk papier. Mijn uitgangspunt is dat de uitkomst van elk spel willekeurig is, met waarschijnlijkheid $ \ frac {1} {2} $ voor elk team dat wint.

Mijn conclusie is dat:

$$ \ rm P (4 \; games) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; games) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; games) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; games) = \ frac {40} {2 ^ 7} = 31,25 \% $$

Ik heb mijn analyse geleid op basis van het idee dat een serie van 4 games een waarschijnlijkheid van $ \ frac {2} {2 ^ 4} $ zou moeten hebben, analoog aan de kans om 4 munten om te draaien en een van beide 4 te krijgen kop of 4 staarten. De noemers waren gemakkelijk genoeg om vanaf daar te achterhalen. Ik kreeg de tellers door het aantal “legale” combinaties te tellen (WWLWWLL zou illegaal zijn aangezien de reeks na 5 games zou worden beslist, de laatste 2 games zouden niet worden gespeeld) van resultaten voor een bepaald aantal games:

Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL 

Wat “is een niet-brute-force-methode om de tellers af te leiden? Ik denk dat er mogelijk een recursieve definitie is, zodat $ \ rm P (5 \; games) $ kan worden gedefinieerd in termen van $ \ rm P (4 \; games) $ enzovoort, en / of dat het combinaties kan zijn zoals $ \ rm (kans \; van \; op \; tenminste \; 4/7 \; W) \ maal (kans \; van \; legaal \; combinatie \; van \; 7 \ ; outcomes) $, maar ik “zit een beetje vast. Aanvankelijk dacht ik aan een aantal ideeën met $ \ left (^ n_k \ right) $, maar het lijkt erop dat dit alleen werkt als de volgorde van de resultaten er niet toe doet.

Interessant is dat een andere wederzijdse vriend wat statistieken haalde over 7 gespeelde gameseries (NHL, NBA, MLB 1905-2013, 1220-series) en kwam met:

4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73% 

Dat is eigenlijk een redelijk goede match (tenminste vanuit het standpunt van mijn astronoom!). Ik denk dat de discrepantie komt doordat de uitkomst van elke wedstrijd vooringenomen is in de richting van een overwinning voor het ene of het andere team (inderdaad, teams worden meestal in de eerste ronde geplaatst, zodat het leidende kwalificatieteam het team speelt dat zich nauwelijks heeft gekwalificeerd, tweede plaats speelt op een na laatste, enzovoort … en de meeste games zijn in de eerste ronde).

Reacties

  • Ben niet bepaald actief op CV.SE, dus dit kan een beetje opnieuw taggen nodig hebben.

Antwoord

Voor een team om [de serie] in game N te winnen, moeten ze precies 3 van de eerste N-1 games hebben gewonnen. Voor game zeven zijn er $ \ binom {6} {3} = 20 $ manieren om dat te doen. Er zijn 2 mogelijke uitkomsten voor game zeven en 20 mogelijke combinaties van overwinningen voor elk van de teams die kunnen winnen, dus 40 mogelijke resultaten. Voor een N-game-serie eindigt een best-of-seven-serie N spellen, het aantal mogelijkheden is $ 2 \ binom {N-1} {3} $.

De volgorde doet er inderdaad niet toe, i Als je al het aantal gespeelde spellen hebt gekregen. Alleen het laatste spel is van belang, en de winnaar moet 3 eerdere overwinningen hebben behaald, in willekeurige volgorde.

Opmerkingen

  • Voor een N-spelreeks mag ' Is het $ 2 (^ {N-1} _ {{\ rm floor} (N / 2)}) $, of iets dergelijks? Ervan uitgaande dat er een oneven aantal spellen is, wat alleen maar verstandig is.
  • Ik gebruikte N als het aantal spellen dat werd gespeeld in een best-of-seven. Bijv. voor N = 4 geeft $ 2 \ binom {3} {3} = 2 $ je het aantal mogelijke manieren waarop de serie in 4 games kan eindigen. d.w.z. voor elk team, het aantal manieren om 3 overwinningen uit 3 games te kiezen.
  • Ja, de mogelijkheden van een M-game-serie die in N games is bepaald, moeten $ 2 \ binom {N-1} {zijn \ mathrm {verdieping} (M / 2)} $. Dit zal nog steeds werken als er ' een even aantal games is, als een gelijkspel niet als beslist wordt beschouwd.
  • Als je realistisch wilt zijn, is de kans op winst mag niet 0,5 zijn voor elk team voor elke game. Er zou bijvoorbeeld een thuisijsvoordeel kunnen zijn.
  • @MichaelChernick waar, en ik ga hier een beetje op in de laatste alinea van de vraag, maar 0,5 als uitgangspunt dat later kan worden aangepast is redelijk .

Antwoord

Een alternatieve manier om naar te kijken is binominale distributie: je hebt x = 3 nodig (precies 3 successen) in n = 6 (paden), dus als de kans om een wedstrijd te winnen 0,5 is (beide teams evenzo), zou binominaal P (x = 3) = 6C3 * (.5) ^ 3 * (.6 ) ^ 3 = .3125 Dit zou betekenen dat er 31,25% kans is om naar 7 gameseries te gaan. En de kans dat je wint in het 7e spel, zou de negatieve binominale waarde volgen, hoeveel sporen = 7 voor 4 succes, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *