NCAA parentes poängsystem

Inledning

Under NCAA 2015 basket turnering för män vann jag vår kontorspool genom att (1) plocka då obesegrad Kentucky att förlora – även om tidigare än deras faktiska Final Four-förlust mot Wisconsin – och (2) plocka Duke för att vinna mästerskapet. Det var en come-from-behind-seger för min konsol, som flyttade från 14: e plats till 7: e till 1: a … under de senaste tre matcherna i 63-spelsturneringen.

Men skulle jag ha vunnit? Vår pool använde det gemensamma fästningssystemet för att tilldela:

  • 1 poäng för varje rätt val i första omgången av 64 lag,
  • 2 poäng för varje rätt val i andra omgången av 32 lag,
  • 4 poäng för varje rätt val i den tredje omgången av 16 lag,
  • 8 poäng för varje rätt val i den fjärde omgången av åtta lag,
  • 16 poäng för varje rätt val i de två Final Four-matcherna,
  • 32 poäng för korrekt val av mästaren.

Detta ”dubbla” system har flera rimliga matematiska motiv. Till exempel är varje spelomgång potentiellt värt samma antal poäng (32). Om du antar att alla lagen är jämnt matchade – eller motsvarande, förutsätter du att du gör alla dina val genom att vända en rättvis mynt – då minskar det förväntade poängantalet med exakt hälften för varje omgång.

Men lagen matchas inte lika och du gör inte dina val genom att vända mynt. Intuitivt verkar det då så här gör Ubling-systemet kan överväga vikten av senare omgångar, och kanske innebär ett bättre system mindre extrema poängökningar per spel från en omgång till en annan. Ett av de mer underhållande vanliga förslagen är en progression baserad på Fibonacci-sekvensen, med spel i varje omgång värda 2, 3, 5, 8, 13 respektive 21 poäng. Mitt mål i det här inlägget är att beskriva ett sätt för att mer exakt utvärdera och jämföra dessa och andra klassificeringssystem.

Sannolikhetsmodell för turneringsspel

Först behöver vi ett sätt att modellera. sannolikheten för att korrekt välja ett visst spel. En rimligt enkel utgångspunkt är att anta att alla spel är oberoende, med varje utgångs sannolikhet endast beroende på lagens frön. Mer exakt, låt P vara en 16 × 16 matris med poster

som indikerar sannolikheten för att frö i slår frö j, var är något mått på ”styrka” av frö i (minskar i), och k är en skalningsfaktor som effektivt bestämmer intervallet för de resulterande sannolikheterna. Till exempel, om varje spel är en myntflip; i den andra ytterligheten, om, då har ett 16: e frö noll sannolikhet för en första omgång upprörd mot ett första frö. För den här diskussionen kommer k att väljas så att

baserat på iakttagelsen att, i 124 match-ups under de senaste 31 åren av det aktuella turneringsformatet, har ett 1: a seed hittills aldrig förlorat till en 16: e Denna sannolikhet är det förväntade värdet för motsvarande beta-distribution.

Jag använde en enkel version av den här modellen för ett år sedan för att uppskatta sannolikheten för att välja en ”perfekt konsol”, det vill säga att välja alla 63 spel korrekt, med en linjär styrka-funktion:

så det beror bara på skillnaden mellan frön. Även den här mycket enkla modellen är inte så dålig, som visas i följande uppdaterade figur, med den linjära förutsägelsesmodellen i rött och de senaste 31 åren av historiska data visas i blått, med motsvarande 95% konfidensintervall i svart. Som de ofta mycket breda konfidensintervallen antyder är 31 år fortfarande inte mycket data; till exempel har det bara funnits 7 matchningar mellan frön som skiljer sig med 10: 1: a vs 11: e delas 3-3, och ett enda 2: a frön vann över en 12: e.

Sannolikheten att vinna som en funktion av fröskillnad: punktuppskattning (blå), 95% konfidensintervall (svart) och linjär förutsägelsemodell (röd).

Som vanligt visar det sig att detta inte var en ny idé; Schwertman et. al. (se Referenser i slutet av detta inlägg) betraktade samma modell redan 1991, liksom en annan icke-linjär styrka funktion som visar sig vara en bättre historisk passform:

var är kvantilfunktionen av den normala fördelningen, och är det totala antalet Division I-herr basketlag. Tanken är att ”styrkorna” för alla lag distribueras normalt, med de 64 lagen i turneringen som de ”starkaste” lagen i den övre svansen av denna distribution. Jag kommer att använda denna styrka för resten av diskussionen.

Beräkningssannolikheter för korrekta val

Med tanke på vilken matris P som vi väljer kan vi använda den för att beräkna den resulterande fördelningen av fröet som vinner ett visst spel i turneringen. Om och är 16-elements kolumnvektorer med () som indikerar sannolikheten för att hemmalaget (besökande) i ett visst spel är sådd i, så ges fördelningen av fröet som vinner det spelet av

var är den elementvisa Hadamard-produkten.I den första omgången är var och en en basvektor. Observera att inkludering av båda termerna i summeringen egentligen bara är en beräkningsfunktion, åtminstone inom en region, eftersom endast en av de två termernas motsvarande komponenter för ett givet frö är noll.

Av genom att använda denna formel iterat för varje spel i varje på varandra följande runda kan vi så småningom beräkna sannolikheten för att varje frö vinner varje spel i turneringen. Följande Python-kod beräknar till exempel fördelningen av vinnaren av någon av de fyra regionala mästerskapen (bland 16 lag vardera):

De resulterande förutsagda sannolikheterna visas i följande figur i rött – med hjälp av normal kvantitetsstyrkefunktion ovan – jämfört med de faktiska frekvenserna i blått.

Vinnare av regionalt mästerskap: faktisk frekvens (blå) och förutsagd sannolikhet (röd).

Bracket-poängsystem

Nu när vi har ett sätt att beräkna sannolikheten för att ett visst lag vinner ett visst spel kan vi utvärdera en färdig konsol genom att beräkna det förväntade antalet korrekta val i varje omgång. Antag till exempel att vårt fäste helt enkelt väljer favoriten (dvs. den högre säden) för att vinna varje spel. Då kommer det förväntade antalet korrekta val att vara:

  • 23.156 av 32 matcher i första omgången,
  • 9.847 av 16 matcher i andra omgången,
  • 4.292 av 8 matcher i tredje omgången,
  • 1.792 av 4 matcher i fjärde omgången regionala mästerskap,
  • 0.540 av 2 matcher i Final Four,
  • 0,156 i det sista mästerskapet.

Vid denna tidpunkt kan vi jämföra olika parentespoängsystem genom att jämföra det förväntade antalet poäng i varje omgång med dessa system. Följande tabell visar till exempel de förväntade poängen per omgång för de två hittills nämnda systemen: dubbelsystemet (1, 2, 4, 8, 16, 32) och Fibonacci-systemet (2, 3, 5, 8, 13 , 21), normaliserat till 1 poäng per spel i första omgången.

Vilket av dessa eller andra system som är ”bäst” beror på vilken typ av pool du vill ha. Med dubbelsystemet (eller ännu större framsteg ) kan du ha en ”spännande” pool med hästkapplöpning, med ledningsbyten och flera bidrag som har en chans att vinna under alla sex omgångarna. Med Fibonacci-systemet (eller till och med mer gradvisa framsteg) kan du ha en pool som belönar forskning och korrekt förutsägelse av tidiga störningar … men en sådan pool kan vara effektivt över långt innan Final Four.

Bilaga: Historiska data

Följande matriser innehåller rekord av alla vinster och förluster, efter match och runda matchning, för de 31 turneringarna i nuvarande format från 1985 till 2015. Först följande 16 × 16 matris anger antalet regionala spel – det vill säga i första till fjärde omgången – där frö jag slog frö j. Observera att omgången där varje spel spelades också bestäms implicit av matchningen av utsäde (t.ex. 1 mot 16 är i första omgången etc.).

 0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Följande matris, i samma format, är för (femte omgången) Final Four-matcher:

 12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Och slutligen för mästerskapsspel:

Leave a Reply

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *