Introduktion
I løbet af NCAA’s basketballturnering til mænd i 2015 vandt jeg vores kontorpulje ved (1) at vælge den derefter ubesejrede Kentucky at tabe – skønt tidligere end deres faktiske Final Four-tab mod Wisconsin – og (2) vælge Duke for at vinde mesterskabet. Det var en come-from-behind-sejr for min beslag, der flyttede fra 14. plads til 7. til 1.… i løbet af de sidste tre spil i 63-spilsturneringen.
Men skulle jeg have vundet? Vores pulje brugte det fælles system til at tildele bracket:
- 1 point for hver korrekte valg i første runde af 64 hold,
- 2 point for hver korrekte valg i anden runde på 32 hold,
- 4 point for hver korrekte valg i tredje runde på 16 hold,
- 8 point for hver korrekte valg i fjerde runde på 8 hold,
- 16 point for hvert korrekt valg i de to sidste fire spil,
- 32 point for korrekt valg af mesteren.
Dette “fordoblingssystem” har adskillige rimelige matematiske motiver. For eksempel er hver runde af spil potentielt det samme antal point værd (32). Hvis man antager, at alle holdene er ensartede – eller ækvivalent, forudsat at du foretager alle dine valg ved at vende en fair mønt – så falder det forventede antal point scoret med nøjagtigt halvdelen for hver runde.
Men hold er ikke ens med hinanden, og du foretager ikke dine valg ved at vende mønter. Intuitivt ser det ud til sådan gør det ubling-system overvægter måske vigtigheden af senere runder, og måske involverer et bedre system mindre ekstreme stigninger i point pr. spil fra en runde til den næste. Et af de mere morsomme almindelige forslag er en progression baseret på Fibonacci-sekvensen, hvor spil i hver runde er henholdsvis 2, 3, 5, 8, 13 og 21 point. Mit mål i dette indlæg er at beskrive et middel til mere nøjagtig evaluering og sammenligning af disse og andre bracketscore-systemer.
Sandsynlighedsmodel for turneringsspil
Først har vi brug for en måde at modellere på. sandsynligheden for korrekt valg af et bestemt spil. Et rimeligt simpelt udgangspunkt er at antage, at alle spil er uafhængige, idet hvert udfalds sandsynlighed kun afhænger af holdets frø. Mere præcist, lad P være en 16 × 16 matrix med poster
, der indikerer sandsynligheden for, at frø i slår frø j, hvor er et mål for “styrke” af frø i (faldende i i), og k er en skaleringsfaktor, der effektivt bestemmer rækkevidden af resulterende sandsynligheder. F.eks. hvis hvert spil er en møntklap; på den anden ekstrem, hvis, så har et 16. frø nul sandsynlighed for en første runde forstyrret mod et 1. frø. Til denne diskussion vælges k således, at
på baggrund af observationen, at i 124 match-ups i løbet af de sidste 31 år af det nuværende turneringsformat, har et 1. seed indtil videre aldrig tabt til en 16. Denne sandsynlighed er den forventede værdi af den tilsvarende beta-distribution.
Jeg brugte en simpel version af denne model for et år siden til at estimere sandsynligheden for at vælge en “perfekt parentes”, dvs. vælge alle 63 spil korrekt ved hjælp af en lineær styrkefunktion:
så det afhænger kun af forskellen mellem frø. Selv denne meget enkle model er ikke så dårlig, som vist i den følgende opdaterede figur, med den lineære forudsigelsesmodel i rødt og de sidste 31 år med historiske data vist i blåt, med tilsvarende 95% konfidensintervaller i sort. Som de ofte meget brede tillidsintervaller antyder, er 31 år stadig ikke meget data; for eksempel har der kun været 7 match-ups mellem frø, der adskiller sig med 10: 1. vs 11. deles 3-3, og et enkelt 2. frø vandt over en 12..
Sandsynligheden for at vinde som en funktion af frøforskel: punktestimat (blå), 95% konfidensinterval (sort) og lineær forudsigelsesmodel (rød).
Som sædvanlig viser det sig, at dette ikke var en ny idé; Schwertman et. al. (se Referencer i slutningen af dette indlæg) betragtede den samme model tilbage i 1991 såvel som en anden ikke-lineær styrkefunktion, der viser sig at være en bedre historisk pasform:
hvor er kvantilfunktionen af den normale fordeling og er det samlede antal Division I mænds basketballhold. Tanken er, at “styrkerne” for alle hold normalt fordeles, idet de 64 hold i turneringen består af de “stærkeste” hold i den øverste hale af denne distribution. Jeg vil bruge denne styrkefunktion til den resterende del af denne diskussion.
Beregnings sandsynligheder for korrekte valg
Givet uanset hvilken matrix P sandsynligheder vi vælger, kan vi bruge den til at beregne den resulterende fordeling af frøet, der vinder et bestemt spil i turneringen. Hvis og er 16-elementers søjlevektorer med (), der indikerer sandsynligheden for, at hjemmeholdet (besøgende) i et bestemt spil er seedet i, så fordelingen af det frø, der vinder det spil, gives ved
hvor er det elementvise Hadamard-produkt.I den første runde er hver og en basisvektor. Bemærk, at inkludering af begge termer i opsummeringen egentlig kun er en beregningsvenlighed, i det mindste inden for en region, for for et givet frø er kun en af de to udtryks tilsvarende komponenter ikke-nul.
Af ved at anvende denne formel iterativt for hvert spil i hver på hinanden følgende runde, kan vi til sidst beregne sandsynligheden for, at hvert frø vinder hvert spil i turneringen. For eksempel beregner følgende Python-kode fordelingen af vinderen af et af de fire regionale mesterskaber (blandt 16 hold hver):
De resulterende forudsagte sandsynligheder vises i den følgende figur med rødt – ved hjælp af normal kvantilstyrkefunktion over – sammenlignet med de faktiske frekvenser i blåt.
Vinder af regionalt mesterskab: faktisk frekvens (blå) og forudsagt sandsynlighed (rød).
Beslagscoresystemer
Nu hvor vi har et middel til at beregne sandsynligheden for, at et bestemt hold vinder et bestemt spil, kan vi evaluere en afsluttet parentes ved at beregne det forventede antal korrekte valg i hver runde. Antag for eksempel, at vores beslag blot vælger favoritten (dvs. det højere frø) til at vinde hvert spil. Derefter vil det forventede antal korrekte valg være:
- 23.156 ud af 32 spil i første runde,
- 9.847 ud af 16 spil i anden runde,
- 4.292 af 8 spil i tredje runde,
- 1.792 af 4 spil i fjerde runde regionale mesterskaber,
- 0.540 af 2 spil i Final Four,
- 0,156 i det sidste mesterskabsspil.
På dette tidspunkt kan vi sammenligne forskellige beslagscoresystemer ved at sammenligne det forventede antal point scoret i hver runde ved hjælp af disse systemer. For eksempel viser følgende tabel de forventede point pr. Runde for de to hidtil nævnte systemer: fordoblingssystemet (1, 2, 4, 8, 16, 32) og Fibonacci-systemet (2, 3, 5, 8, 13 , 21), normaliseret til 1 point pr. Runde i første runde.
Hvilket af disse eller ethvert andet system er “bedst” afhænger af, hvilken slags pool du ønsker. Med fordoblingssystemet (eller endnu større fremskridt ), kan du have en “spændende” hestevæddeløbspool med blyændringer og flere bidrag, der har en chance for at vinde i alle seks runder. Med Fibonacci-systemet (eller endnu mere gradvise fremskridt) kan du have en pulje, der belønner forskning og nøjagtig forudsigelse af tidlige forstyrrelser … men en sådan pool kan være effektivt over godt inden Final Four.
Appendiks: Historiske data
Følgende matricer indeholder registreringen af alle sejre og tab efter match og runde match for de 31 turneringer i det aktuelle format fra 1985 til 2015. Først de følgende 16 × 16 matrix angiver antallet af regionale spil – det vil sige i første til fjerde runde – hvor frø jeg slog frø j. Bemærk, at den runde, hvor hvert spil blev spillet, også implicit bestemmes af match match (f.eks. 1 mod 16 er i første runde osv.).
0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Følgende matrix, i samme format, er til (femte runde) Final Four-spil:
12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Og til sidst til mesterskabsspil: