Inleiding
Tijdens het NCAA basketbaltoernooi voor heren 2015 won ik onze kantoorpool door (1) toen ongeslagen te kiezen Kentucky te verliezen – hoewel eerder dan hun daadwerkelijke Final Four-verlies voor Wisconsin – en (2) Duke uitkiezen om de kampioenswedstrijd te winnen. Het was een ‘come-from-behind’-overwinning voor mijn groep, van de 14e naar de 7e naar de 1e … over de duur van de laatste drie games in het toernooi met 63 games.
Maar had ik moeten winnen? Onze poule maakte gebruik van het gebruikelijke bracket-scoresysteem:
- 1 punt voor elke juiste keuze in de eerste ronde van 64 teams,
- 2 punten voor elke juiste keuze in de tweede ronde van 32 teams,
- 4 punten voor elke juiste keuze in de derde ronde van 16 teams,
- 8 punten voor elke juiste keuze in de vierde ronde van 8 teams,
- 16 punten voor elke juiste keuze in de twee Final Four-spellen,
- 32 punten voor het correct kiezen van de kampioen.
Dit “verdubbelings” -systeem heeft verschillende redelijke wiskundige motivaties. Elke ronde van games is bijvoorbeeld in potentie hetzelfde aantal punten waard (32). Ook, ervan uitgaande dat alle teams gelijkmatig of gelijkwaardig zijn, ervan uitgaande dat u al uw keuzes maakt door een fair om te draaien munt – dan neemt het verwachte aantal gescoorde punten met precies de helft af met elke ronde.
Maar teams zijn niet gelijkmatig op elkaar afgestemd en je maakt je keuzes niet door munten om te draaien. Intuïtief lijkt het dus zoals dit doen Een dergelijk systeem zou het belang van latere rondes kunnen overtreffen, en misschien houdt een beter systeem in dat er minder extreme puntenstijgingen per spel van de ene ronde naar de volgende worden gespeeld. Een van de leukere algemene suggesties is een progressie op basis van de Fibonacci-reeks, waarbij games in elke ronde respectievelijk 2, 3, 5, 8, 13 en 21 punten waard zijn. Mijn doel in dit bericht is om een manier te beschrijven om deze en andere bracket-scoresystemen nauwkeuriger te evalueren en te vergelijken.
Waarschijnlijkheidsmodel voor toernooispellen
Ten eerste hebben we een manier nodig om te modelleren de kans om een bepaald spel correct te kiezen. Een redelijk eenvoudig uitgangspunt is om aan te nemen dat alle games onafhankelijk zijn, waarbij de waarschijnlijkheid van elke uitkomst alleen afhangt van de zaden van de teams. Preciezer gezegd, laat P een 16 × 16 matrix zijn met ingangen
die de waarschijnlijkheid aangeeft dat zaadje i verslaat zaad j, waar een maat is voor de “sterkte” van zaadje i (afnemend in i), en k is een schaalfactor die effectief het bereik van de resulterende kansen bepaalt. Bijvoorbeeld, als, dan is elk spel een coinflip, aan het andere uiterste, if, dan heeft een 16e zaad geen kans dat een eerste ronde wordt verstoord tegen een eerste zaad. Voor deze discussie wordt k gekozen zodat
gebaseerd op de observatie dat in 124 wedstrijden in de afgelopen 31 jaar van het huidige toernooiformat een eerste zaadje tot dusver nooit heeft verloren van een zestiende seed. Deze kans is de verwachte waarde van de overeenkomstige bèta-verdeling.
Ik heb een jaar geleden een eenvoudige versie van dit model gebruikt om de kans te schatten dat ik een ‘perfect bracket’ kies, dat wil zeggen: alle 63 spellen correct, met behulp van een lineaire sterktefunctie:
dus dat hangt alleen af van het verschil tussen zaden. Zelfs dit zeer eenvoudige model valt mee, zoals wordt getoond in de volgende bijgewerkte figuur, met het lineaire voorspellingsmodel in rood en de laatste 31 jaar aan historische gegevens in blauw, met bijbehorende 95% betrouwbaarheidsintervallen in het zwart. Zoals de vaak zeer brede betrouwbaarheidsintervallen suggereren, zijn 31 jaar nog steeds niet veel gegevens; er zijn bijvoorbeeld slechts 7 match-ups geweest tussen zaden met een verschil van 10: 1e versus 11e worden 3-3 gesplitst, en een enkel 2e zaadje wint over een 12e.
Kans om te winnen als functie van het zaadverschil: puntschatting (blauw), 95% betrouwbaarheidsinterval (zwart) en lineair voorspellingsmodel (rood).
Zoals gebruikelijk blijkt dat dit niet het geval was een nieuw idee; Schwertman et. al. (zie verwijzingen aan het einde van dit bericht) beschouwde ditzelfde model al in 1991, evenals een andere niet-lineaire sterktefunctie die een betere historische fit blijkt te zijn:
waar is de kwantielfunctie van de normale verdeling, en is het totale aantal Divisie I basketbalteams voor heren. Het idee is dat de “sterke punten” van alle teams normaal worden verdeeld, waarbij de 64 teams in het toernooi de “sterkste” teams vormen in de bovenste staart van deze verdeling. Ik zal deze sterktefunctie gebruiken voor de rest van deze discussie.
Berekenen van waarschijnlijkheden van juiste keuzes
Gegeven welke matrix P van waarschijnlijkheden we ook kiezen, kunnen we deze gebruiken om de resulterende verdeling te berekenen van het zaad dat een bepaald spel in het toernooi wint. Als en zijn kolomvectoren met 16 elementen met () die de waarschijnlijkheid aangeven dat het thuisploeg (bezoekende) team in een bepaald spel is geplaatst i, dan wordt de verdeling van het zaad dat dat spel wint gegeven door
waar is het elementaire Hadamard-product.In de eerste ronde is elk een basisvector. Merk op dat het opnemen van beide termen in de sommatie in feite slechts een rekenkundig gemak is, althans binnen een regio, aangezien voor een bepaald kiemgetal slechts één van de corresponderende componenten van de twee termen niet-nul zal zijn.
Door Door deze formule iteratief toe te passen voor elk spel in elke volgende ronde, kunnen we uiteindelijk de kans berekenen dat elk zaadje elk spel in het toernooi wint. De volgende Python-code berekent bijvoorbeeld de verdeling van de winnaar van een van de vier regionale kampioenschappen (elk onder 16 teams):
De resulterende voorspelde kansen worden in de volgende afbeelding in rood weergegeven – met de normale kwantielsterkte-functie hierboven – vergeleken met de werkelijke frequenties in blauw.
Winnaar van regionaal kampioenschap: werkelijke frequentie (blauw) en voorspelde waarschijnlijkheid (rood).
Bracket-scoresystemen
Nu we een manier hebben om de kans te berekenen dat een bepaald team een bepaald spel wint, kunnen we een voltooide bracket evalueren door het verwachte aantal juiste tips in elke ronde te berekenen. Stel bijvoorbeeld dat onze bracket gewoon de favoriet kiest (d.w.z. het hogere zaad) om elk spel te winnen. Dan is het verwachte aantal juiste tips:
- 23.156 van 32 games in de eerste ronde,
- 9.847 van 16 games in de tweede ronde,
- 4.292 van 8 games in de derde ronde,
- 1.792 van 4 games in de regionale kampioenschappen van de vierde ronde,
- 0.540 van 2 games in de Final Four,
- 0.156 van de laatste kampioenswedstrijd.
Op dit punt kunnen we verschillende bracketscoresystemen vergelijken door het verwachte aantal punten dat in elke ronde wordt gescoord met behulp van die systemen te vergelijken. De volgende tabel toont bijvoorbeeld de verwachte punten per ronde voor de twee tot nu toe genoemde systemen: het verdubbelingssysteem (1, 2, 4, 8, 16, 32) en het Fibonacci-systeem (2, 3, 5, 8, 13 , 21), genormaliseerd naar 1 punt per spel in de eerste ronde.
Welk van deze of andere systemen het “beste” is, hangt af van wat voor soort pool je wilt. Met het verdubbelingssysteem (of zelfs grotere progressies ), kun je een “opwindende” paardenrace-achtige pool hebben, met wisselingen in de voorsprong en meerdere inzendingen die kans maken om te winnen gedurende alle zes ronden. Met het Fibonacci-systeem (of zelfs meer geleidelijke progressies), kun je een pool hebben die onderzoek en nauwkeurige voorspelling van vroege ronde verstoringen beloont … maar zo’n pool kan effectief voorbij zijn ruim voor de Final Four.
Bijlage: Historische gegevens
De volgende matrices bevatten het record van alle overwinningen en verliezen, per ronde en zaadmatch-up, voor de 31 toernooien in het huidige formaat van 1985 tot en met 2015. Ten eerste, de volgende 16 × 16 matrix geeft het aantal regionale spellen aan – dat wil zeggen, in de eerste tot en met vierde ronde – waarin zaad i verslaat zaad j. Merk op dat de ronde waarin elke game werd gespeeld ook impliciet wordt bepaald door de matchup (bijv. 1 vs. 16 is in de eerste ronde, enz.).
0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
De volgende matrix, in hetzelfde formaat, is voor (vijfde ronde) Final Four-spellen:
12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
En tot slot voor kampioenschapsspelen: