Antecedentes: un amigo mío tiene un pasatiempo (como me imagino que hacen muchos) de intentar predecir los resultados de los playoffs de hockey. Intenta adivinar el equipo ganador en cada enfrentamiento y la cantidad de juegos necesarios para ganar (para cualquiera que no esté familiarizado con el hockey de la NHL, una serie se decide al mejor de 7). Su récord este año después de 3 rondas de juego (8 + 4 + 2 = 14 al mejor de 7 enfrentamientos) es 7 correctos / 7 incorrectos para el equipo ganador y 4 correctos / 10 incorrectos para el número de juegos (solo considera el número de juegos correcto si también eligió al equipo ganador).
Empezamos a bromear diciendo que no está haciendo nada mejor que adivinar a ciegas en la pregunta de los equipos, pero que está superando sustancialmente las probabilidades si se asume que las probabilidades para una serie de juegos de 4, 5, 6 o 7 son iguales (se esperaría una tasa de éxito del 12.5%, él es del 28.5%).
Esto nos hizo preguntarnos cuáles son las probabilidades en realidad para cada número posible de juegos. Creo que lo he resuelto, pero quiero atar algunos cabos sueltos, ya que parte de mi enfoque fue hacer garabatos de fuerza bruta en una gran hoja de papel. Mi suposición básica es que el resultado de cada juego es aleatorio con probabilidad $ \ frac {1} {2} $ para que gane cada equipo.
Mi conclusión es que:
$$ \ rm P (4 \; juegos) = \ frac {2} {2 ^ 4} = 12.5 \% \\ P (5 \; juegos) = \ frac {8} {2 ^ 5} = 25 \% \\ P (6 \; juegos) = \ frac {20} {2 ^ 6} = 31.25 \% \\ P (7 \; juegos) = \ frac {40} {2 ^ 7} = 31.25 \% $$
Guié mi análisis basándome en la noción de que una serie de 4 juegos debería tener una probabilidad de $ \ frac {2} {2 ^ 4} $, análoga a las probabilidades de lanzar 4 monedas y obtener 4 cabezas o 4 colas. Los denominadores fueron bastante fáciles de averiguar a partir de ahí. Obtuve los numeradores contando el número de combinaciones «legales» (WWLWWLL sería ilegal ya que la serie se decidiría después de 5 juegos, los 2 últimos juegos no se jugarían) de resultados para un número determinado de juegos:
Possible 4 game series (2): WWWW LLLL Possible 5 game series (8): LWWWW WLLLL WLWWW LWLLL WWLWW LLWLL WWWLW LLLWL Possible 6 game series (20): LLWWWW WWLLLL LWLWWW WLWLLL LWWLWW WLLWLL LWWWLW WLLLWL WLLWWW LWWLLL WLWLWW LWLWLL WLWWLW LWLLWL WWLLWW LLWWLL WWLWLW LLWLWL WWWLLW LLLWWL Possible 7 game series (40): LLLWWWW WWWLLLL LLWLWWW WWLWLLL LLWWLWW WWLLWLL LLWWWLW WWLLLWL LWLLWWW WLWWLLL LWLWLWW WLWLWLL LWLWWLW WLWLLWL LWWLLWW WLLWWLL LWWLWLW WLLWLWL LWWWLLW WLLLWWL WLLLWWW LWWWLLL WLLWLWW LWWLWLL WLLWWLW LWWLLWL WLWLLWW LWLWWLL WLWLWLW LWLWLWL WLWWLLW LWLLWWL WWLLLWW LLWWWLL WWLLWLW LLWWLWL WWLWLLW LLWLWWL WWWLLLW LLLWWWL
¿Qué es un método sin fuerza bruta para derivar los numeradores? Estoy pensando que puede haber una definición recursiva, de modo que $ \ rm P (5 \; juegos) $ se puede definir en términos de $ \ rm P (4 \; juegos) $ y así sucesivamente, y / o que puede involucrar combinaciones como $ \ rm (probabilidad \; de \; al \; mínimo \; 4/7 \; W) \ veces (probabilidad \; de \; combinación \; legal \; de \; 7 \ ; resultados) $, pero estoy un poco atascado. Inicialmente pensé en algunas ideas relacionadas con $ \ left (^ n_k \ right) $ pero parece que solo funciona si el orden de los resultados no importa.
Curiosamente, otro amigo en común sacó algunas estadísticas sobre 7 series de juegos jugados (NHL, NBA, MLB 1905-2013, series 1220) y presentó:
4 Game Series - 202 times - 16.5% 5 Game Series - 320 times - 26.23% 6 Game Series - 384 times - 31.47% 7 Game Series - 314 times - 25.73%
Eso es en realidad una buena combinación (¡al menos desde el punto de vista de mi astrónomo!). Supongo que la discrepancia proviene de que el resultado de cada juego esté sesgado hacia una victoria para un equipo u otro (de hecho, los equipos generalmente se colocan en la primera ronda de modo que el equipo líder en la clasificación juega contra el equipo que apenas se clasificó, el segundo lugar juega el penúltimo, y así sucesivamente … y la mayoría de los juegos están en la primera ronda).
Comentarios
- No soy particularmente activo en CV.SE, por lo que es posible que sea necesario volver a etiquetarlo.
Responder
Para un equipo para ganar [la serie] en el juego N, deben haber ganado exactamente 3 de los primeros juegos N-1. Para el juego siete, hay $ \ binom {6} {3} = 20 $ formas de hacerlo. Hay 2 posibles resultados para el séptimo juego y 20 posibles combinaciones de victorias para cada uno de los equipos que pueden ganar, por lo que 40 posibles resultados. Para una serie de N-juegos , una serie al mejor de siete para terminar en N juegos, la cantidad de posibilidades es $ 2 \ binom {N-1} {3} $.
De hecho, el orden no importa, yo Si ya tienes el número de juegos jugados. Solo importa el último juego, y el ganador debe tener 3 victorias anteriores, en cualquier orden.
Comentarios
- Para una serie de juegos N, no debería ' ¿t es $ 2 (^ {N-1} _ {{\ rm floor} (N / 2)}) $, o algo así? Suponiendo que hay un número impar de juegos, lo cual es sensato.
- Estaba usando N como el número de juegos jugados en un mejor de siete. P.ej. para N = 4, $ 2 \ binom {3} {3} = 2 $ te da el número de posibles formas en que la serie puede terminar en 4 juegos. es decir. para cada equipo, la cantidad de formas de elegir 3 victorias de 3 juegos.
- Sí, las posibilidades de una serie de juegos M decidida en N juegos deben ser $ 2 \ binom {N-1} { \ mathrm {piso} (M / 2)} $. Esto seguirá funcionando si ' hay un número par de juegos, si las series empatadas no se consideran decididas.
- Si va a ser realista, la probabilidad de la victoria no debe ser de 0,5 para cada equipo en cada juego. Podría haber una ventaja de local como un ejemplo.
- @MichaelChernick es cierto, y lo menciono un poco en el último párrafo de la pregunta, pero 0.5 como punto de partida que luego se puede ajustar es razonable .
Respuesta
Una forma alternativa de ver sería la distribución binomial: necesita x = 3 (exactamente 3 éxitos) en n = 6 (senderos), por lo que si la probabilidad de ganar un juego es .5 (ambos equipos tienen la misma probabilidad), el binomio diría P (x = 3) = 6C3 * (.5) ^ 3 * (.6 ) ^ 3 = .3125 Esto significaría que hay un 31,25% de posibilidades de ir a 7 series de juegos. Y la probabilidad de que ganes en el séptimo juego seguiría un binomio negativo, cuántos caminos = 7 para 4 éxitos, 7-1 C 4-1 * (.5) ^ 3 * (.5) ^ 4