Statistiky sedmi sérií play-off

Souvislosti: můj přítel má jako koníček (jak si mnoho lidí představuji) snahu předpovídat výsledky hokejového play-off. Snaží se uhodnout vítězný tým v každém zápase a počet her potřebných k vítězství (pro každého, kdo není obeznámen s hokejem NHL, o sérii rozhoduje nejlepší ze 7). Jeho letošní rekord po 3 kolech hry (8 + 4 + 2 = 14 nejlepších ze 7 zápasů) je 7 správných / 7 nesprávných pro vítězný tým a 4 správné / 10 nesprávných pro počet her (považuje pouze správný počet her pokud si také vybral vítězný tým).

Začali jsme žertovat, že se mu nedaří lépe než slepé hádání o otázce týmů, ale že podstatně překonává šance, pokud předpokládáme, že pravděpodobnosti pro herní série 4, 5, 6 nebo 7 jsou stejné (očekával by 12,5% úspěšnost, on je na 28,5%).

To nás zajímalo, jaké jsou ve skutečnosti šance na každé možné číslo her. Myslím, že jsem to vyřešil, ale chci uvázat pár volných konců, protože součástí mého přístupu bylo hrubou silou čmárající na velký kus papíru. Můj základní předpoklad je, že výsledek každé hry je náhodný s pravděpodobností, že každý tým vyhraje $ \ frac {1} {2} $.

Můj závěr je, že:

$$ \ rm P (4 \; hry) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; hry) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; hry) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; hry) = \ frac {40} {2 ^ 7} = 31,25 \% $$

Při analýze jsem vycházel z představy, že by herní série 4 měla mít pravděpodobnost $ \ frac {2} {2 ^ 4} $, analogicky s pravděpodobností převrácení 4 mincí a získání buď 4 hlavy nebo 4 ocasy. Jmenovatelé byli natolik snadní, aby to odtamtud zjistili. Čitatele jsem získal spočítáním počtu „legálních“ kombinací (WWLWWLL by bylo nezákonné, protože o sérii by se rozhodlo po 5 hrách, poslední 2 hry by se hrát neměly) výsledků pro daný počet her:

Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL 

Jaká je metoda jiné než hrubé síly pro odvození čitatelů? Myslím, že může existovat rekurzivní definice, takže $ \ rm P (5 \; hry) $ lze definovat z hlediska $ \ rm P (4 \; hry) $ atd. atd. / nebo že to může zahrnovat kombinace jako $ \ rm (pravděpodobnost \; z \; alespoň \; 4/7 \; W) \ krát (pravděpodobnost \; z \; legální \; kombinace \; z \; 7 \ ; outcomes) $, ale já „jsem trochu zaseknutý. Zpočátku jsem myslel na nějaké nápady týkající se $ \ left (^ n_k \ right) $, ale zdá se, že to funguje, pouze pokud na pořadí výsledků nezáleží.

Zajímavé je, že další společný přítel vytáhl některé statistiky ze 7 odehraných herních sérií (NHL, NBA, MLB 1905-2013, série 1220) a přišel s:

4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73% 

To je ve skutečnosti docela dobrá shoda (alespoň z pohledu mého astronoma!). Domnívám se, že nesrovnalosti vycházejí z výsledku každé hry, která byla zaujatá směrem k výhře jednoho nebo druhého týmu (týmy jsou obvykle nasazeny v prvním kole, takže vedoucí kvalifikační tým hraje tým, který se sotva kvalifikoval, druhé místo hraje druhé poslední atd. a většina her je v prvním kole).

Komentáře

  • Nejsem nijak zvlášť aktivní na CV.SE, takže to může vyžadovat trochu nového značkování.

Odpověď

Pro tým, který vyhrál [sérii] ve hře N, musel vyhrát přesně 3 z prvních her N-1. U hry sedm existuje $ \ binom {6} {3} = 20 $ způsoby, jak toho dosáhnout. Existují 2 možné výsledky pro hru sedm a 20 možných kombinací výher pro každý z týmů, které mohou vyhrát, takže 40 možných výsledků. Pro série N-her série nejlepších ze sedmi skončí N her, počet možností je $ 2 \ binom {N-1} {3} $.

Ve skutečnosti na pořadí nezáleží, já Pokud jste již dostali počet odehraných her. Důležitá je pouze poslední hra a vítěz musí mít 3 předchozí vítězství v jakémkoli pořadí.

Komentáře

  • U série her N by neměla ' není to $ 2 (^ {N-1} _ {{\ rm floor} (N / 2)}) $, nebo něco takového? Za předpokladu, že existuje lichý počet her, což je jen rozumné.
  • Použil jsem N jako počet her hraných v nejlepší ze sedmi. Např. pro N = 4 vám $ 2 \ binom {3} {3} = 2 $ dává počet možných způsobů, jak může série skončit ve 4 hrách. tj. pro každý tým počet způsobů, jak vybrat 3 ze 3 her.
  • Ano, možnosti série M-her rozhodnuté v N hrách by měly být $ 2 \ binom {N-1} { \ mathrm {floor} (M / 2)} $. To bude fungovat, i když ' bude sudý počet her, pokud se nerozhodne o vázaných sériích.
  • Pokud budete realističtí, pravděpodobnost výhra by neměla být 0,5 pro každý tým pro každou hru. Jako jeden příklad by mohla existovat výhoda domácího ledu.
  • @MichaelChernick pravda, trochu se toho dotknu v posledním odstavci otázky, ale 0,5 jako výchozí bod, který lze později upravit, je rozumný .

Odpověď

Alternativním způsobem pohledu by bylo binomické rozdělení: Potřebujete x = 3 (přesně 3 úspěchy) v n = 6 (stezky), takže pokud je pravděpodobnost výhry hry 0,5 (oba týmy mají stejnou šanci), binomický by řekl P (x = 3) = 6C3 * (.5) ^ 3 * (0,6 ) ^ 3 = .3125 To by znamenalo 31,25% šanci jít do 7 herních sérií. A pravděpodobnost, kterou v 7. hře vyhrajete, by následovala negativní binomii, kolik stezek = 7 za úspěch 4, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *