Introducción
Durante el torneo de baloncesto masculino de la NCAA 2015, gané el grupo de nuestra oficina al (1) elegir al entonces invicto Kentucky perderá, aunque antes de su derrota real en la Final Four ante Wisconsin, y (2) elegir a Duke para ganar el campeonato. Fue una victoria vencida para mi grupo, pasando del puesto 14 al 7 al 1… en el lapso de los últimos tres juegos en el torneo de 63 juegos.
¿Pero debería haber ganado? Nuestro grupo utilizó el sistema común de puntuación de paréntesis para asignar:
- 1 punto por cada selección correcta en la primera ronda de 64 equipos,
- 2 puntos por cada selección correcta en la segunda ronda de 32 equipos,
- 4 puntos por cada selección correcta en la tercera ronda de 16 equipos,
- 8 puntos por cada selección correcta en la cuarta ronda de 8 equipos,
- 16 puntos por cada elección correcta en los dos juegos de la Final Four,
- 32 puntos por elegir correctamente al campeón.
Este sistema de «duplicación» tiene Varias motivaciones matemáticas razonables. Por ejemplo, cada ronda de juegos potencialmente vale la misma cantidad de puntos (32). Además, suponiendo que todos los equipos estén igualados, o de manera equivalente, asumiendo que haces todas tus selecciones lanzando una moneda: entonces la cantidad esperada de puntos anotados disminuye exactamente a la mitad con cada ronda.
Pero los equipos no están igualados, y no haces tus elecciones lanzando monedas. Intuitivamente, entonces, parece como este hacer El sistema ubling podría estar sobrestimando la importancia de rondas posteriores, y quizás un mejor sistema implica aumentos menos extremos en los puntos por juego de una ronda a la siguiente. Una de las sugerencias comunes más divertidas es una progresión basada en la secuencia de Fibonacci, con juegos en cada ronda que valen 2, 3, 5, 8, 13 y 21 puntos, respectivamente. Mi objetivo en esta publicación es describir un medio para evaluar y comparar con mayor precisión estos y otros sistemas de puntuación de grupos.
Modelo de probabilidad para juegos de torneo
Primero, necesitamos una forma de modelar la probabilidad de elegir correctamente cualquier juego en particular. Un punto de partida razonablemente simple es asumir que todos los juegos son independientes, y que la probabilidad de cada resultado depende solo de las semillas de los equipos. Más precisamente, sea P una matriz de 16 × 16 con entradas
que indican la probabilidad de que la semilla i supere a la semilla j, donde es alguna medida de «fuerza» de la semilla i (disminuyendo en i), y k es un factor de escala que determina efectivamente el rango de probabilidades resultantes. Por ejemplo, si, entonces cada juego es un lanzamiento de moneda; en el otro extremo, si, entonces un puesto número 16 tiene una probabilidad cero de una derrota en la primera ronda contra un primer puesto. Para esta discusión, se elegirá k de modo que
basado en la observación de que, en 124 enfrentamientos en los últimos 31 años del formato de torneo actual, un primer sembrado nunca ha perdido hasta el momento un decimosexto semilla. Esta probabilidad es el valor esperado de la distribución beta correspondiente.
Usé una versión simple de este modelo hace un año para estimar la probabilidad de elegir un «soporte perfecto», es decir, elegir todos los 63 juegos correctamente, usando una función de fuerza lineal:
de modo que eso depende solo de la diferencia entre semillas. Incluso este modelo muy simple no es tan malo, como se muestra en la siguiente figura actualizada, con el modelo de predicción lineal en rojo, y los últimos 31 años de datos históricos mostrados en azul, con los correspondientes intervalos de confianza del 95% en negro. Como sugieren los intervalos de confianza a menudo muy amplios, 31 años todavía no son muchos datos; por ejemplo, solo ha habido 7 enfrentamientos entre cabezas de serie que difieren en 10: el 1º y el 11º se dividen 3-3, y un solo 2º sembrado ganó sobre el 12º.
Probabilidad de ganar en función de la diferencia inicial: estimación puntual (azul), intervalo de confianza del 95% (negro) y modelo de predicción lineal (rojo).
Como de costumbre, resulta que esto no fue una nueva idea; Schwertman y col. Alabama. (ver Referencias al final de esta publicación) consideró este mismo modelo en 1991, así como otra función de fuerza no lineal que resulta ser un mejor ajuste histórico:
¿Dónde está la función cuantil de la distribución normal, y es el número total de equipos de baloncesto masculino de la División I. La idea es que las «fortalezas» de todos los equipos se distribuyan normalmente, con los 64 equipos en el torneo que comprenden los equipos «más fuertes» en la cola superior de esta distribución. Usaré esta función de fuerza durante el resto de esta discusión.
Calcular probabilidades de elecciones correctas
Dada cualquier matriz P de probabilidades que elijamos, podemos usarla para calcular la distribución resultante de la semilla ganando cualquier juego en particular en el torneo. Si y son vectores de columna de 16 elementos con () que indica la probabilidad de que el equipo local (visitante) en un juego en particular sea cabeza de serie i, entonces la distribución de la semilla que gana ese juego viene dada por
donde es el producto Hadamard basado en elementos.En la primera ronda, cada y es un vector base. Tenga en cuenta que incluir ambos términos en la suma es realmente solo una conveniencia computacional, al menos dentro de una región, ya que para una semilla dada, solo uno de los componentes correspondientes de los dos términos será distinto de cero.
Por Al aplicar esta fórmula de forma iterativa para cada juego en cada ronda sucesiva, eventualmente podemos calcular la probabilidad de que cada semilla gane cada juego en el torneo. Por ejemplo, el siguiente código de Python calcula la distribución del ganador de cualquiera de los cuatro campeonatos regionales (entre 16 equipos cada uno):
Las probabilidades pronosticadas resultantes se muestran en la siguiente figura en rojo, usando el función de fuerza cuantílica normal anterior – en comparación con las frecuencias reales en azul.
Ganador del campeonato regional: frecuencia real (azul) y probabilidad predicha (rojo).
Sistemas de puntuación de paréntesis
Ahora que tenemos un medio para calcular la probabilidad de que cualquier equipo en particular gane un juego en particular, podemos evaluar un paréntesis completo calculando el número esperado de selecciones correctas en cada ronda. Por ejemplo, supongamos que nuestro grupo simplemente elige al favorito (es decir, la semilla más alta) para ganar todos los juegos. Entonces, el número esperado de selecciones correctas será:
- 23.156 de 32 juegos en la primera ronda,
- 9.847 de 16 juegos en la segunda ronda,
- 4.292 de 8 juegos en la tercera ronda,
- 1.792 de 4 juegos en los campeonatos regionales de cuarta ronda,
- 0.540 de 2 juegos en la Final Four,
- 0.156 del juego del campeonato final.
En este punto, podemos comparar varios sistemas de puntuación de grupos comparando el número esperado de puntos anotados en cada ronda usando esos sistemas. Por ejemplo, la siguiente tabla muestra los puntos esperados por ronda para los dos sistemas mencionados hasta ahora: el sistema de duplicación (1, 2, 4, 8, 16, 32) y el sistema de Fibonacci (2, 3, 5, 8, 13 , 21), normalizado a 1 punto por partida de primera ronda.
Cuál de estos o cualquier otro sistema es «mejor» depende del tipo de grupo que desee. Con el sistema de duplicación (o incluso mayores progresiones ), puede tener un grupo «emocionante» de carreras de caballos, con cambios de liderazgo y múltiples entradas que tienen la oportunidad de ganar en las seis rondas. Con el sistema Fibonacci (o incluso progresiones más graduales), puede tener un grupo que recompense la investigación y la predicción precisa de las sorpresas en las primeras rondas … pero tal grupo puede terminar efectivamente mucho antes de la Final Four.
Apéndice: Datos históricos
Las siguientes matrices contienen el registro de todas las victorias y derrotas, por ronda y emparejamiento de cabezas de serie, para los 31 torneos en el formato actual desde 1985 hasta 2015. Primero, los siguientes 16 × La matriz 16 indica el número de juegos regionales, es decir, de la primera a la cuarta rondas, en los que la semilla i venció a la semilla j. Tenga en cuenta que la ronda en la que se jugó cada juego también está implícitamente determinada por el emparejamiento de semillas (por ejemplo, 1 contra 16 en la primera ronda, etc.).
0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
La siguiente matriz, en el mismo formato, es para juegos de Final Four (quinta ronda):
12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Y finalmente para juegos de campeonato: