Bakgrund: en av mina vänner gör en hobby (som jag antar att många gör) att försöka förutsäga slutresultat för hockey. Han försöker gissa det vinnande laget i varje matchup och antalet spel som behövs för att vinna (för alla som inte känner till NHL-hockey bestäms en serie av de bästa 7). Hans rekord i år efter 3 spelomgångar (8 + 4 + 2 = 14 bästa av 7 matchups) är 7 korrekta / 7 felaktiga för vinnande lag och 4 korrekta / 10 felaktiga för antal matcher (han anser bara att antalet spel är korrekta om han också valde det vinnande laget).
Vi fick skämta att han inte gör bättre än att blinda gissa på lagfrågan, men att han väsentligen slår oddsen om man antar att sannolikheterna för 4, 5, 6 eller 7 spelserier är lika (förväntar oss en framgångsgrad på 12,5%, han är 28,5%).
Detta fick oss att undra vad oddsen egentligen är för varje möjligt antal Jag tror att jag har ordnat det, men jag vill binda upp några lösa ändar eftersom en del av mitt tillvägagångssätt var brute-force som klottrade på ett stort papper. Mitt grundläggande antagande är att resultatet för varje spel är slumpmässigt med sannolikheten $ \ frac {1} {2} $ för varje lag att vinna.
Min slutsats är att:
$$ \ rm P (4 \; spel) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; spel) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; spel) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; spel) = \ frac {40} {2 ^ 7} = 31,25 \% $$
Jag vägledde min analys baserat på en uppfattning att en 4-spelserie skulle ha en sannolikhet på $ \ frac {2} {2 ^ 4} $, analogt med oddsen att vända 4 mynt och få antingen 4 huvuden eller 4 svansar. Nämnarna var enkla att räkna ut därifrån. Jag fick räknarna genom att räkna antalet ”lagliga” kombinationer (WWLWWLL skulle vara olagligt eftersom serien skulle avgöras efter 5 matcher, de senaste två spelen skulle inte spelas) av resultat för ett givet antal spel:
Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL
Vad är en metod utan brute-kraft för att härleda täljarna? Jag tänker att det kan finnas en rekursiv definition, så att $ \ rm P (5 \; spel) $ kan definieras i termer av $ \ rm P (4 \; spel) $ och så vidare, och / eller att det kan innefatta kombinationer som $ \ rm (sannolikhet \; av \; minst \; 4/7 \; W) \ gånger (sannolikhet \; av \; laglig \; kombination \; av \; 7 \ ; utfall) $, men jag har fastnat lite. Inledningsvis tänkte jag på några idéer som involverade $ \ left (^ n_k \ right) $ men det verkar som att det bara fungerar om ordningsföljden inte betyder något.
Intressant nog tog en annan gemensam vän ut lite statistik över de 7 spelade serierna (NHL, NBA, MLB 1905-2013, 1220-serien) och kom med:
4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73%
Det är faktiskt en ganska bra match (åtminstone ur min astronomers synvinkel!). Jag antar att avvikelsen kommer från att resultatet av varje spel har varit partisk mot en vinst för det ena eller det andra laget (faktiskt så sätts lag vanligtvis ut i första omgången så att det ledande kvalificerande laget spelar laget som knappt kvalificerade sig, andraplatsen spelar näst sista, och så vidare … och de flesta spelen är i första omgången.
Kommentarer
- Är inte särskilt aktiv på CV.SE, så detta kan behöva lite taggning på nytt.
Svar
För en lag för att vinna [serien] i spel N, måste de ha vunnit exakt 3 av de första N-1-spelen. För spel sju finns det $ \ binom {6} {3} = 20 $ sätt att göra det. Det finns 2 möjliga utfall för match sju och 20 möjliga kombinationer av vinster för vart och ett av lagen som kan vinna, så 40 möjliga utfall. För en N-spelserie en best-of-seven-serie att avsluta i N spel, antalet möjligheter är $ 2 \ binom {N-1} {3} $.
Faktum är att ordningen inte spelar någon roll, jag om du redan har angett antalet spelade spel. Endast det sista spelet spelar roll, och vinnaren måste ha tre tidigare vinster, i valfri ordning.
Kommentarer
- För en N-spelserie bör inte ' t det $ 2 (^ {N-1} _ {{\ rm floor} (N / 2)}) $, eller något liknande? Förutsatt att det finns ett udda antal spel, vilket bara är förnuftigt.
- Jag använde N som antalet spel som spelades i bästa av sju. T.ex. för N = 4, $ 2 \ binom {3} {3} = 2 $ ger dig antalet möjliga sätt som serien kan sluta i fyra spel. dvs. för varje lag, antalet sätt att välja 3 vinner av tre matcher.
- Ja, möjligheterna för en M-spelserie som bestäms i N-spel, bör vara $ 2 \ binom {N-1} { \ mathrm {våning} (M / 2)} $. Detta kommer fortfarande att fungera om ' är ett jämnt antal spel, om bundna serier inte anses vara avgjorda.
- Om du ska vara realistisk är sannolikheten för vinsten bör inte vara 0,5 för varje lag för varje spel. Det kan finnas en fördel med hemmetsis som ett exempel.
- @MichaelChernick sant, och jag berör det här lite i sista stycket i frågan, men 0,5 som utgångspunkt som senare kan justeras är rimligt .
Svar
Ett alternativt sätt att titta på skulle vara binomial fördelning: Du behöver x = 3 (exakt 3 framgångar) i n = 6 (spår), så om sannolikheten för att vinna ett spel är .5 (båda lagen är lika), skulle binomial säga P (x = 3) = 6C3 * (.5) ^ 3 * (.6 ) ^ 3 = .3125 Detta skulle innebära en chans på 31,25% att gå till 7 spelserier. Och sannolikheten att du vinner i det sjunde spelet, skulle följa negativ binomial, hur många spår = 7 för 4 framgångar, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4