Statistik over 7 spil slutspilserier

Baggrund: en af mine venner laver en hobby (som jeg forestiller mig, at mange gør) for at forsøge at forudsige hockey-slutspilsresultater. Han forsøger at gætte det vindende hold i hver matchup, og antallet af spil, der er nødvendige for at vinde (for enhver, der ikke er bekendt med NHL-hockey, afgøres en serie af de bedste 7). Hans rekord i år efter 3 spilrunder (8 + 4 + 2 = 14 bedste af 7 matchups) er 7 korrekte / 7 forkerte for vindende hold og 4 korrekte / 10 forkerte for antal spil (han anser kun antallet af spil for korrekt hvis han også valgte det vindende hold).

Vi fik en sjov om, at han ikke gør det bedre end at blinde gætte på holdets spørgsmål, men at han i det væsentlige slår oddsen, hvis man antager, at sandsynlighederne for en 4, 5, 6 eller 7 spilserie er ens (forventer en succesrate på 12,5%, han er på 28,5%).

Dette fik os til at undre os over, hvad oddsene faktisk er for hvert mulige antal Jeg tror, jeg har arbejdet med det, men jeg vil binde et par løse ender, da en del af min tilgang var brute-force, der klatrede på et stort stykke papir. Min grundlæggende antagelse er, at resultatet af hvert spil er tilfældigt med sandsynligheden $ \ frac {1} {2} $ for hvert hold at vinde.

Min konklusion er, at:

$$ \ rm P (4 \; spil) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; spil) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; spil) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; spil) = \ frac {40} {2 ^ 7} = 31,25 \% $$

Jeg styrede min analyse baseret på en forestilling om, at en 4-spilserie skulle have en sandsynlighed på $ \ frac {2} {2 ^ 4} $, svarende til oddsene for at vende 4 mønter og få enten 4 hoveder eller 4 haler. Benævnerne var lette nok til at finde ud af derfra. Jeg fik tællerne ved at tælle antallet af “lovlige” kombinationer (WWLWWLL ville være ulovligt, da serien ville blive besluttet efter 5 spil, de sidste 2 spil ville ikke blive spillet) af resultaterne for et givet antal spil:

Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL 

Hvad er en metode, der ikke er en brutal kraft til at udlede tællerne? Jeg tænker, at der kan være en rekursiv definition, så $ \ rm P (5 \; spil) $ kan defineres i form af $ \ rm P (4 \; spil) $ og så videre, og / eller at det kan involvere kombinationer som $ \ rm (sandsynlighed \; af \; mindst \; 4/7 \; W) \ gange (sandsynlighed \; af \; lovlig \; kombination \; af \; 7 \ ; udfald) $, men jeg blev lidt fast. Oprindeligt tænkte jeg på nogle ideer, der involverede $ \ left (^ n_k \ right) $, men det ser ud til, at det kun virker, hvis rækkefølgen af resultater ikke betyder noget.

Interessant nok hentede en anden fælles ven nogle statistikker over de 7 spil-serier, der blev spillet (NHL, NBA, MLB 1905-2013, 1220-serien) og kom med:

4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73% 

Det er faktisk et ret godt match (i det mindste set fra min astronomers synspunkt!). Jeg gætter på, at uoverensstemmelsen kommer fra, at resultatet af hvert spil er forudindtaget til en sejr for det ene hold eller det andet (faktisk hold er normalt seedet i første runde, så det førende kvalificerende hold spiller det hold, der næppe kvalificerede sig andenpladsen spiller næstsidste, og så videre … og de fleste spil er i første runde).

Kommentarer

  • Er ikke særlig aktiv på CV.SE, så dette kan kræve en smule re-tagging.

Svar

For en hold til at vinde [serien] i spil N, skal de have vundet nøjagtigt 3 af de første N-1-spil. For spil syv er der $ \ binom {6} {3} = 20 $ måder at gøre det på. 2 mulige resultater for spil syv og 20 mulige kombinationer af sejre for hvert af de hold, der kan vinde, så 40 mulige resultater. For en N-game-serie en best-of-syv serie at slutte i N spil, antallet af muligheder er $ 2 \ binom {N-1} {3} $.

Faktisk betyder rækkefølgen ikke noget, jeg hvis du allerede har angivet antallet af spillede spil. Kun det sidste spil betyder noget, og vinderen skal have 3 tidligere sejre i en hvilken som helst rækkefølge.

Kommentarer

  • For en N-spilserie skal ' t det være $ 2 (^ {N-1} _ {{\ rm etage} (N / 2)}) $, eller noget lignende? Forudsat at der er et ulige antal spil, hvilket kun er fornuftigt.
  • Jeg brugte N som antallet af spil, der blev spillet i en af de bedste syv. For eksempel. for N = 4, $ 2 \ binom {3} {3} = 2 $ giver dig antallet af mulige måder, serien kan ende på 4 spil. dvs. for hvert hold, antallet af måder at vælge 3 sejre ud af 3 spil.
  • Ja, mulighederne for en M-spil-serie, der besluttes i N-spil, skal være $ 2 \ binom {N-1} { \ mathrm {etage} (M / 2)} $. Dette fungerer stadig, hvis der ' er et lige antal spil, hvis bundne serier ikke betragtes som besluttede.
  • Hvis du vil være realistisk, er sandsynligheden for sejr bør ikke være 0,5 for hvert hold for hvert spil. Der kan være en fordel ved hjemmebanen som et eksempel.
  • @MichaelChernick sandt, og jeg rører lidt ved dette i spørgsmålets sidste afsnit, men 0,5 som udgangspunkt, der senere kan justeres, er rimeligt .

Svar

En alternativ måde at se på ville være binomialfordeling: Du har brug for x = 3 (nøjagtigt 3 succeser) i n = 6 (stier), så hvis sandsynligheden for at vinde et spil er 0,5 (begge hold er lige ens), vil binomial sige P (x = 3) = 6C3 * (.5) ^ 3 * (.6 ) ^ 3 = .3125 Dette vil betyde, at der er 31,25% chance for at gå til 7 spilserier. Og sandsynligheden for, at du vinder i det 7. spil, ville følge negativ binomial, hvor mange stier = 7 for 4 succes, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *