Statistikk over syv spill-sluttserier

Bakgrunn: en venn av meg lager en hobby (som jeg forestiller meg at mange gjør) med å prøve å forutsi utfall av hockey-sluttspill. Han prøver å gjette det vinnende laget i hver kamp, og antall kamper som trengs for å vinne (for alle som ikke er kjent med NHL-hockey, avgjøres en serie av de beste 7). Hans rekord i år etter 3 spillrunder (8 + 4 + 2 = 14 beste av 7 matchups) er 7 riktige / 7 feil for det vinnende laget og 4 riktige / 10 feil for antall kamper (han anser bare antall kamper som riktige hvis han også plukket ut det vinnende laget).

Vi fikk spøk med at han ikke gjør noe bedre enn å gjette blinde på teamspørsmålet, men at han i det vesentlige slår oddsen hvis man antar at sannsynlighetene for en 4, 5, 6 eller 7 spillserie er lik (forventer en suksessrate på 12,5%, han er på 28,5%).

Dette fikk oss til å lure på hva oddsen faktisk er for hvert mulig tall Jeg tror jeg har trent det, men jeg vil binde noen løse ender siden en del av tilnærmingen min var brute-force-skribling på et stort stykke papir. Min grunnleggende antagelse er at utfallet av hvert spill er tilfeldig med sannsynligheten $ \ frac {1} {2} $ for hvert lag å vinne.

Min konklusjon er at:

$$ \ rm P (4 \; spill) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; spill) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; spill) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; spill) = \ frac {40} {2 ^ 7} = 31,25 \% $$

Jeg ledet analysen min basert på en forestilling om at en 4-spillserie skulle ha sannsynligheten for $ \ frac {2} {2 ^ 4} $, analogt med oddsen for å vende 4 mynter og få enten 4 hoder eller 4 haler. Nevnerne var lette nok til å finne ut derfra. Jeg fikk tellerne ved å telle antall «lovlige» kombinasjoner (WWLWWLL ville være ulovlig siden serien skulle avgjøres etter 5 kamper, de to siste kampene ville ikke bli spilt) av resultater for et gitt antall spill:

Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL 

Hva er en metode som ikke er brute-force for å utlede tellerne? Jeg tenker at det kan være en rekursiv definisjon, slik at $ \ rm P (5 \; spill) $ kan defineres i form av $ \ rm P (4 \; spill) $ og så videre, og / eller at det kan involvere kombinasjoner som $ \ rm (sannsynlighet \; av \; minst \; 4/7 \; W) \ ganger (sannsynlighet \; av \; lovlig \; kombinasjon \; av \; 7 \ ; utfall) $, men jeg ble litt fast. Opprinnelig tenkte jeg på noen ideer som involverte $ \ left (^ n_k \ right) $, men det ser ut til at det bare virker hvis rekkefølgen på utfallet ikke betyr noe.

Interessant nok, en annen felles venn hentet litt statistikk over 7 spilleserier som ble spilt (NHL, NBA, MLB 1905-2013, 1220-serien) og kom med:

4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73% 

Det er faktisk en ganske god kamp (i det minste fra astronomens synspunkt!). Jeg antar at avviket kommer fra at utfallet av at hver kamp har vært partisk mot en seier for det ene eller det andre laget (faktisk blir lag vanligvis sådd i første runde slik at det ledende kvalifiserende laget spiller laget som knapt kvalifiserte seg, andreplass spiller nest sist, og så videre … og de fleste spillene er i første runde).

Kommentarer

  • Er ikke spesielt aktiv på CV.SE, så dette kan kreve litt ommerking.

Svar

For en for å vinne [serien] i spill N, må de ha vunnet nøyaktig 3 av de første N-1-kampene. For spill syv er det $ \ binom {6} {3} = 20 $ måter å gjøre det på. Det er 2 mulige utfall for kamp syv og 20 mulige kombinasjoner av seire for hvert av lagene som kan vinne, så 40 mulige utfall. For en N-game-serie en best-of-seven-serie å avslutte i N spill, antall muligheter er $ 2 \ binom {N-1} {3} $.

Faktisk spiller ikke ordren noen rolle, i hvis du allerede har oppgitt antall spill. Bare det siste spillet betyr noe, og vinneren må ha 3 tidligere seire, i hvilken som helst rekkefølge.

Kommentarer

  • For en N-spillserie bør ikke ' t det være $ 2 (^ {N-1} _ {{\ rm etasje} (N / 2)}) $, eller noe sånt? Forutsatt at det er et ulikt antall spill, som bare er fornuftig.
  • Jeg brukte N som antall spill som ble spilt i en best-of-seven. F.eks. for N = 4, $ 2 \ binom {3} {3} = 2 $ gir deg antall mulige måter serien kan ende på 4 spill. dvs. for hvert lag, antall måter å velge 3 vinner av tre kamper.
  • Ja, mulighetene for en M-spillserie som avgjøres i N-spill, bør være $ 2 \ binom {N-1} { \ mathrm {etasje} (M / 2)} $. Dette vil fremdeles fungere hvis ' er et jevnt antall spill, hvis uavhengige serier ikke anses å være avgjort.
  • Hvis du skal være realistisk, er sannsynligheten for seier skal ikke være 0,5 for hvert lag for hvert spill. Det kan være en fordel med hjemmeisen som ett eksempel.
  • @MichaelChernick sant, og jeg berører dette litt i siste avsnitt av spørsmålet, men 0,5 som utgangspunkt som senere kan justeres er rimelig .

Svar

En alternativ måte å se på ville være binomial fordeling: Du trenger x = 3 (nøyaktig 3 suksesser) i n = 6 (løyper), så hvis sannsynligheten for å vinne et spill er 0,5 (begge lag er like lik), vil binomial si P (x = 3) = 6C3 * (, 5) ^ 3 * (.6 ) ^ 3 = .3125 Dette vil bety at det er 31,25% sjanse for å gå til 7 spillserier. Og sannsynligheten du vinner i det 7. spillet, vil følge negativ binomial, hvor mange stier = 7 for 4 suksess, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *