Einführung
Während des NCAA-Männerbasketballturniers 2015 gewann ich unseren Büropool, indem ich (1) die damals ungeschlagene Auswahl auswählte Kentucky zu verlieren – obwohl früher als ihre tatsächliche Final Four Niederlage gegen Wisconsin – und (2) Duke auswählen, um das Meisterschaftsspiel zu gewinnen. Es war ein Rückstandssieg für meine Klammer, der sich in den letzten drei Spielen des 63-Spiele-Turniers vom 14. auf den 7. auf den 1. Platz bewegte.
Aber hätte ich gewinnen sollen? Unser Pool verwendete das gemeinsame Bracket-Scoring-System, um Folgendes zuzuweisen:
- 1 Punkt für jede richtige Auswahl in der ersten Runde von 64 Teams,
- 2 Punkte für jede richtige Auswahl in der zweite Runde von 32 Teams,
- 4 Punkte für jede richtige Auswahl in der dritten Runde von 16 Teams,
- 8 Punkte für jede richtige Auswahl in der vierten Runde von 8 Teams,
- 16 Punkte für jede richtige Auswahl in den beiden Final Four-Spielen,
- 32 Punkte für die richtige Auswahl des Champions.
Dieses „Verdopplungssystem“ hat Mehrere vernünftige mathematische Motivationen. Zum Beispiel ist jede Spielrunde möglicherweise die gleiche Anzahl von Punkten wert (32). Vorausgesetzt, alle Teams sind gleichberechtigt – oder gleichwertig, vorausgesetzt, Sie treffen alle Ihre Entscheidungen, indem Sie eine Messe umdrehen Münze – dann verringert sich die erwartete Anzahl der erzielten Punkte mit jeder Runde um genau die Hälfte.
Aber die Teams sind nicht gleichmäßig aufeinander abgestimmt, und Sie treffen Ihre Auswahl nicht, indem Sie Münzen werfen. Intuitiv scheint es also so tun Das Ubling-System könnte die Bedeutung späterer Runden übergewichten, und vielleicht beinhaltet ein besseres System weniger extreme Punkterhöhungen pro Spiel von einer Runde zur nächsten. Einer der amüsantesten Vorschläge ist ein Fortschritt, der auf der Fibonacci-Sequenz basiert und in jeder Runde Spiele mit 2, 3, 5, 8, 13 bzw. 21 Punkten enthält. Mein Ziel in diesem Beitrag ist es, ein Mittel zu beschreiben, mit dem diese und andere Bracket-Scoring-Systeme genauer bewertet und verglichen werden können.
Wahrscheinlichkeitsmodell für Turnierspiele
Zunächst benötigen wir eine Möglichkeit zum Modellieren die Wahrscheinlichkeit, ein bestimmtes Spiel richtig auszuwählen. Ein einigermaßen einfacher Ausgangspunkt ist die Annahme, dass alle Spiele unabhängig sind, wobei die Wahrscheinlichkeit jedes Ergebnisses nur von den Samen der Teams abhängt. Genauer gesagt, sei P eine 16 × 16-Matrix mit Einträgen
, die die Wahrscheinlichkeit angeben, dass der Samen i den Samen j schlägt, wobei ein Maß für die „Stärke“ des Samens i (abnehmend in i) ist und k ist Ein Skalierungsfaktor, der den Bereich der resultierenden Wahrscheinlichkeiten effektiv bestimmt. Wenn beispielsweise jedes Spiel ein Münzwurf ist, und im anderen Extremfall, wenn ein 16. Samen keine Wahrscheinlichkeit für eine Störung der ersten Runde gegen einen ersten Samen hat. Für diese Diskussion wird k so gewählt, dass
auf der Beobachtung basiert, dass in 124 Match-Ups in den letzten 31 Jahren des aktuellen Turnierformats ein 1. Samen bisher noch nie gegen einen 16. verloren hat Diese Wahrscheinlichkeit ist der erwartete Wert der entsprechenden Beta-Verteilung.
Ich habe vor einem Jahr eine einfache Version dieses Modells verwendet, um die Wahrscheinlichkeit zu schätzen, eine „perfekte Klammer“ auszuwählen, dh alle 63 auszuwählen Spiele korrekt mit einer linearen Stärkefunktion:
, sodass dies nur vom Unterschied zwischen den Samen abhängt. Selbst dieses sehr einfache Modell ist nicht schlecht, wie in der folgenden aktualisierten Abbildung gezeigt, mit dem linearen Vorhersagemodell in Rot und den historischen Daten der letzten 31 Jahre in Blau mit entsprechenden 95% -Konfidenzintervallen in Schwarz. Wie aus den oft sehr großen Konfidenzintervallen hervorgeht, sind 31 Jahre immer noch nicht viele Daten. Zum Beispiel gab es nur 7 Übereinstimmungen zwischen Samen, die sich um 10 unterschieden: 1. gegen 11. werden 3-3 aufgeteilt, und ein einzelner 2. Samen gewann über einen 12.
Gewinnwahrscheinlichkeit als Funktion der Keimdifferenz: Punktschätzung (blau), 95% -Konfidenzintervall (schwarz) und lineares Vorhersagemodell (rot).
Wie üblich stellt sich heraus, dass dies nicht der Fall war eine neue Idee; Schwertman et. al. (siehe Referenzen am Ende dieses Beitrags) betrachteten dasselbe Modell bereits 1991 sowie eine andere nichtlineare Festigkeitsfunktion, die sich als bessere historische Anpassung herausstellt:
wo ist die Quantilfunktion von die Normalverteilung und ist die Gesamtzahl der Basketballmannschaften der Männer der Division I. Die Idee ist, dass die „Stärken“ aller Teams normal verteilt sind, wobei die 64 Teams im Turnier die „stärksten“ Teams im oberen Bereich dieser Verteilung sind. Ich werde diese Stärkefunktion für den Rest dieser Diskussion verwenden.
Berechnen der Wahrscheinlichkeiten korrekter Picks
Wenn wir eine Matrix P von Wahrscheinlichkeiten wählen, können wir sie verwenden, um die resultierende Verteilung zu berechnen des Samens, der ein bestimmtes Spiel im Turnier gewinnt. Wenn und 16-Element-Spaltenvektoren sind, wobei () die Wahrscheinlichkeit angibt, dass die Heimmannschaft (Gastmannschaft) in einem bestimmten Spiel i gesetzt ist, dann ist die Verteilung des Seeds, der dieses Spiel gewinnt, gegeben durch
wo ist das elementweise Hadamard-Produkt.In der ersten Runde ist jedes und ein Basisvektor. Beachten Sie, dass das Einbeziehen beider Terme in die Summierung zumindest innerhalb einer Region nur eine einfache Berechnung ist, da für einen bestimmten Startwert nur eine der entsprechenden Komponenten der beiden Terme ungleich Null ist.
By Wenn wir diese Formel iterativ für jedes Spiel in jeder aufeinanderfolgenden Runde anwenden, können wir schließlich die Wahrscheinlichkeit berechnen, mit der jeder Samen jedes Spiel im Turnier gewinnt. Der folgende Python-Code berechnet beispielsweise die Verteilung des Gewinners einer der vier regionalen Meisterschaften (auf jeweils 16 Teams):
Die resultierenden vorhergesagten Wahrscheinlichkeiten sind in der folgenden Abbildung in rot dargestellt – unter Verwendung von normale Quantilstärkefunktion oben – verglichen mit den tatsächlichen Frequenzen in Blau.
Gewinner der regionalen Meisterschaft: tatsächliche Häufigkeit (blau) und vorhergesagte Wahrscheinlichkeit (rot).
Bracket-Scoring-Systeme
Nachdem wir nun die Möglichkeit haben, die Wahrscheinlichkeit zu berechnen, dass ein bestimmtes Team ein bestimmtes Spiel gewinnt, können wir eine abgeschlossene Bracket bewerten, indem wir die erwartete Anzahl korrekter Picks in jeder Runde berechnen. Angenommen, unsere Klammer wählt einfach den Favoriten (d. H. Den höheren Samen) aus, um jedes Spiel zu gewinnen. Dann ist die erwartete Anzahl der richtigen Picks:
- 23,156 von 32 Spielen in der ersten Runde,
- 9,847 von 16 Spielen in der zweiten Runde,
- 4,292 von 8 Spielen in der dritten Runde,
- 1,792 von 4 Spielen in der regionalen Meisterschaft der vierten Runde,
- 0,540 von 2 Spielen in den letzten vier,
- 0,156 des letzten Meisterschaftsspiels.
An diesem Punkt können wir verschiedene Bracket-Scoring-Systeme vergleichen, indem wir die erwartete Anzahl von Punkten vergleichen, die in jeder Runde mit diesen Systemen erzielt wurden. Die folgende Tabelle zeigt beispielsweise die erwarteten Punkte pro Runde für die beiden bisher genannten Systeme: das Verdopplungssystem (1, 2, 4, 8, 16, 32) und das Fibonacci-System (2, 3, 5, 8, 13) , 21), normalisiert auf 1 Punkt pro Spiel in der ersten Runde.
Welches dieser oder anderer Systeme „am besten“ ist, hängt davon ab, welche Art von Pool Sie möchten. Mit dem Verdopplungssystem (oder noch größeren Fortschritten) ) können Sie einen „aufregenden“ Pool mit Pferderennen haben, bei dem Führungswechsel und mehrere Einsendungen die Chance haben, in allen sechs Runden zu gewinnen. Mit dem Fibonacci-System (oder noch mehr schrittweisen Fortschritten) können Sie einen Pool haben, der die Forschung und die genaue Vorhersage von Störungen in der Frührunde belohnt. Ein solcher Pool kann jedoch weit vor den letzten vier effektiv abgeschlossen sein.
Anhang: Historische Daten
Die folgenden Matrizen enthalten die Aufzeichnung aller Siege und Verluste nach Runden- und Startspiel für die 31 Turniere im aktuellen Format von 1985 bis 2015. Zunächst die folgenden 16 × Die Matrix 16 gibt die Anzahl der regionalen Spiele an, dh in der ersten bis vierten Runde, in denen der Samen i den Samen j schlug. Beachten Sie, dass die Runde, in der jedes Spiel gespielt wurde, implizit auch durch das Seed-Matchup bestimmt wird (z. B. 1 gegen 16 in der ersten Runde usw.).
0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Die folgende Matrix im gleichen Format gilt für (fünfte Runde) Final Four-Spiele:
12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Und schließlich für Meisterschaftsspiele: