Histórico: um amigo meu tem como hobby (como imagino que muitos fazem) tentar prever os resultados dos playoffs de hóquei. Ele tenta adivinhar o time vencedor em cada confronto e o número de jogos necessários para vencer (para quem não está familiarizado com o hóquei da NHL, uma série é decidida por uma melhor de 7). Seu recorde este ano após 3 rodadas de jogo (8 + 4 + 2 = 14 melhores de 7 partidas) é 7 correto / 7 incorreto para equipe vencedora e 4 correto / 10 incorreto para número de jogos (ele considera apenas o número de jogos correto se ele também escolheu a equipe vencedora).
Começamos a brincar que ele não está se saindo melhor do que adivinhar às cegas na questão das equipes, mas que está substancialmente superando as probabilidades se assumirmos que as probabilidades para uma série de jogos de 4, 5, 6 ou 7 são iguais (seria de esperar uma taxa de sucesso de 12,5%, ele está com 28,5%).
Isso nos fez questionar quais são as chances reais para cada número possível de jogos. Acho que resolvi, mas quero amarrar algumas pontas soltas, já que parte da minha abordagem consistia em rabiscar com força bruta em um grande pedaço de papel. Minha suposição básica é que o resultado de cada jogo é aleatório com probabilidade $ \ frac {1} {2} $ para cada equipe vencer.
Minha conclusão é que:
$$ \ rm P (4 \; jogos) = \ frac {2} {2 ^ 4} = 12,5 \% \\ P (5 \; jogos) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; jogos) = \ frac {20} {2 ^ 6} = 31,25 \% \\ P (7 \; jogos) = \ frac {40} {2 ^ 7} = 31,25 \% $$
Guiei minha análise com base na noção de que uma série de 4 jogos deve ter uma probabilidade de $ \ frac {2} {2 ^ 4} $, análoga à probabilidade de lançar 4 moedas e obter 4 cara ou 4 caudas. Os denominadores foram fáceis de descobrir a partir daí. Peguei os numeradores contando o número de combinações “legais” (WWLWWLL seria ilegal, pois a série seria decidida após 5 jogos, os últimos 2 jogos não seriam jogados) de resultados para um determinado número de jogos:
Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL
O que é “um método de força não bruta para derivar os numeradores? Estou pensando que pode haver uma definição recursiva, de modo que $ \ rm P (5 \; games) $ pode ser definido em termos de $ \ rm P (4 \; games) $ e assim por diante, e / ou que pode envolver combinações como $ \ rm (probabilidade \; de \; pelo menos \; 4/7 \; W) \ vezes (probabilidade \; de \; legal \; combinação \; de \; 7 \ ; resultados) $, mas estou um pouco preso. Inicialmente, pensei em algumas idéias envolvendo $ \ left (^ n_k \ right) $, mas parece que só funciona se a ordem dos resultados não importa.
Curiosamente, outro amigo em comum retirou algumas estatísticas sobre 7 séries de jogos disputadas (NHL, NBA, MLB 1905-2013, séries 1220) e apresentou:
4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73%
Isso é na verdade, uma combinação muito boa (pelo menos do ponto de vista do meu astrônomo!). Eu acho que a discrepância vem do resultado de cada jogo sendo tendencioso para uma vitória para uma equipe ou outra (na verdade, as equipes geralmente são semeadas na primeira rodada, de modo que a equipe qualificada líder joga contra a equipe que mal se classificou, o segundo lugar joga o penúltimo e assim por diante … e a maioria dos jogos é na primeira rodada).
Comentários
- Não sou particularmente ativo em CV.SE, portanto, pode ser necessário um pouco de remarcação.
Resposta
Para um equipe para vencer [a série] no jogo N, eles devem ter vencido exatamente 3 dos primeiros jogos N-1. Para o jogo sete, existem $ \ binom {6} {3} = 20 $ maneiras de fazer isso. 2 resultados possíveis para o jogo sete e 20 combinações possíveis de vitórias para cada uma das equipes que podem vencer, portanto, 40 resultados possíveis. Para uma série de jogos N , uma série melhor de sete para terminar em N jogos, o número de possibilidades é $ 2 \ binom {N-1} {3} $.
Na verdade, a ordem não importa, i Se você já tiver informado o número de jogos disputados. Apenas o último jogo importa, e o vencedor deve ter 3 vitórias anteriores, em qualquer ordem.
Comentários
- Para uma série de jogos N, deveria ' t seja $ 2 (^ {N-1} _ {{\ rm floor} (N / 2)}) $, ou algo parecido? Supondo que haja um número ímpar de jogos, o que é sensato.
- Eu estava usando N como o número de jogos disputados em melhor de sete. Por exemplo. para N = 4, $ 2 \ binom {3} {3} = 2 $ fornece o número de maneiras possíveis para a série terminar em 4 jogos. ie. para cada equipe, o número de maneiras de escolher 3 vitórias em 3 jogos.
- Sim, as possibilidades de uma série de jogos M decidida em N jogos devem ser $ 2 \ binom {N-1} { \ mathrm {floor} (M / 2)} $. Isso ainda funcionará se houver ' s um número par de jogos, se as séries empatadas não forem consideradas decididas.
- Se você for realista, a probabilidade de a vitória não deve ser 0,5 para cada equipe em cada jogo. Poderia haver uma vantagem em casa como um exemplo.
- @MichaelChernick true, e eu mencionei isso um pouco no último parágrafo da pergunta, mas 0,5 como ponto de partida que pode ser ajustado posteriormente é razoável .
Resposta
Uma maneira alternativa de olhar seria a distribuição binomial: você precisa de x = 3 (exatamente 3 sucessos) em n = 6 (trilhas), então se a probabilidade de ganhar um jogo for 0,5 (ambas as equipes igualmente), o binômio diria P (x = 3) = 6C3 * (.5) ^ 3 * (.6 ) ^ 3 = 0,3125 Isso significa que há 31,25% de chance de ir para 7 séries de jogos. E a probabilidade de você ganhar no 7º game seguiria o binômio negativo, quantas trilhas = 7 para 4 sucesso, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4