Statystyki 7 serii play-offów

Tło: mój przyjaciel ma hobby (jak sobie wyobrażam) próbować przewidzieć wyniki playoffów hokejowych. Próbuje odgadnąć zwycięską drużynę w każdym pojedynku i liczbę meczów potrzebnych do wygrania (dla każdego, kto nie zna hokeja NHL, o serii decyduje do 7). Jego tegoroczny rekord po 3 rundach gry (8 + 4 + 2 = 14 najlepszych z 7 meczów) to 7 poprawnych / 7 niepoprawnych dla zwycięskiej drużyny i 4 poprawnych / 10 niepoprawnych pod względem liczby gier (bierze pod uwagę tylko liczbę meczów poprawną jeśli wybrał również zwycięską drużynę).

Żartujemy, że nie radzi sobie lepiej niż ślepe zgadywanie w kwestii drużyn, ale zasadniczo pokonuje szanse, zakładając, że prawdopodobieństwa dla serii 4, 5, 6 lub 7 są równe (można by oczekiwać 12,5% wskaźnika sukcesu, on ma 28,5%).

To sprawiło, że zaczęliśmy się zastanawiać, jakie są faktycznie szanse na każdą możliwą liczbę gier. Myślę, że już to wypracowałem, ale chcę zawiązać kilka luźnych końców, ponieważ część mojego podejścia polegała na brutalnym pisaniu na dużej kartce papieru. Moje podstawowe założenie jest takie, że wynik każdego meczu jest losowy z prawdopodobieństwem $ \ frac {1} {2} $ na zwycięstwo każdej drużyny.

Mój wniosek jest taki:

$$ \ rm P (4 \; games) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; games) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; games) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; games) = \ frac {40} {2 ^ 7} = 31,25 \% $$

W swojej analizie oparłem się na założeniu, że seria 4 gier powinna mieć prawdopodobieństwo $ \ frac {2} {2 ^ 4} $, analogicznie do prawdopodobieństwa przerzucenia 4 monet i otrzymania albo 4 głowy lub 4 ogony. Stamtąd łatwo było ustalić mianowniki. Liczniki otrzymałem, licząc liczbę „legalnych” kombinacji (WWLWWLL byłoby nielegalne, ponieważ seria byłaby rozstrzygnięta po 5 grach, ostatnie 2 gry nie zostałyby rozegrane) wyników dla danej liczby gier:

Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL 

Co to jest „non-brute-force metoda wyliczania liczników? Myślę, że może istnieć rekurencyjna definicja, tak że $ \ rm P (5 \; games) $ można zdefiniować w kategoriach $ \ rm P (4 \; games) $ i tak dalej, i / lub że może obejmować kombinacje takie jak $ \ rm (prawdopodobieństwo \; of \; at \; najmniej \; 4/7 \; W) \ times (prawdopodobieństwo \; of \; legal \; kombinacja \; of \; 7 \ ; wyników) $, ale trochę utknąłem. Początkowo myślałem o kilku pomysłach dotyczących $ \ left (^ n_k \ right) $, ale wydaje się, że działa to tylko wtedy, gdy kolejność wyników nie ma znaczenia.

Co ciekawe, inny wspólny znajomy wyciągnął statystyki dotyczące 7 rozegranych serii gier (NHL, NBA, MLB 1905-2013, seria 1220) i wymyślił:

4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73% 

To jest s właściwie całkiem niezłe dopasowanie (przynajmniej z punktu widzenia mojego astronoma!). Wydaje mi się, że rozbieżność wynika z wyniku każdego meczu, który jest ukierunkowany na wygraną jednej lub drugiej drużyny (w rzeczywistości drużyny są zwykle rozstawiane w pierwszej rundzie, tak że wiodąca drużyna kwalifikacyjna gra z drużyną, która ledwo zakwalifikowała się, drugie miejsce jest przedostatnie i tak dalej … a większość meczów jest w pierwszej rundzie).

Komentarze

  • Nie jestem szczególnie aktywny w CV.SE, więc może to wymagać trochę ponownego otagowania.

Odpowiedź

zespół, aby wygrać [serię] w grze N, muszą wygrać dokładnie 3 z pierwszych gier N-1. W grze siódmej są na to sposoby $ \ binom {6} {3} = 20 $. Są 2 możliwe wyniki w grze siódmej i 20 możliwych kombinacji zwycięstw dla każdej z drużyn, które mogą wygrać, więc 40 możliwych wyników. Dla serii N gier seria do zwycięstwa z siedmiu zakończona N gier, liczba możliwości to 2 $ \ binom {N-1} {3} $.

Rzeczywiście, kolejność nie ma znaczenia, ja Jeśli masz już podaną liczbę rozegranych gier. Liczy się tylko ostatnia gra, a zwycięzca musi mieć 3 poprzednie wygrane w dowolnej kolejności.

Komentarze

  • W przypadku serii N nie powinno być ' t to $ 2 (^ {N-1} _ {{\ rm floor} (N / 2)}) $, czy coś w tym stylu? Zakładając, że jest nieparzysta liczba gier, co jest tylko rozsądne.
  • Użyłem N jako liczby gier rozegranych w najlepszej z siedmiu. Na przykład. dla N = 4, 2 $ \ binom {3} {3} = 2 $ podaje liczbę możliwych sposobów zakończenia serii w 4 grach. to znaczy. dla każdej drużyny liczba sposobów na wybranie 3 zwycięstw z 3 gier.
  • Tak, możliwości serii M-game rozstrzygniętej w N grach powinny wynosić 2 $ \ binom {N-1} { \ mathrm {floor} (M / 2)} $. To będzie nadal działać, jeśli ' jest parzysta liczba gier, jeśli remisowe serie nie zostaną uznane za rozstrzygnięte.
  • Jeśli chcesz być realistą, prawdopodobieństwo wygrana nie powinna wynosić 0,5 dla każdej drużyny w każdej grze. Jednym z przykładów może być przewaga na własnym boisku.
  • @MichaelChernick prawda, i poruszyłem to trochę w ostatnim akapicie pytania, ale 0.5 jako punkt wyjścia, który można później dostosować, jest rozsądne .

Odpowiedź

Alternatywnym sposobem spojrzenia na rozkład dwumianowy: potrzebujesz x = 3 (dokładnie 3 sukcesy) w n = 6 (ślady), więc jeśli prawdopodobieństwo wygranej gry wynosi 0,5 (obie drużyny równie prawdopodobne), w układzie dwumianowym P (x = 3) = 6C3 * (.5) ^ 3 * (.6 ) ^ 3 = 0,3125 Oznaczałoby to 31,25% szans na przejście do 7 serii gier. Prawdopodobieństwo, że wygrasz w siódmej grze, będzie wynikało z ujemnego dwumianu, ile śladów = 7 na 4 sukcesy, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *