Wprowadzenie
Podczas turnieju koszykówki mężczyzn NCAA 2015 wygrałem pulę w biurze, (1) wybierając wtedy niepokonanego Kentucky przegra – choć wcześniej niż jego faktyczna porażka w Final Four z Wisconsin – i (2) wybrał Duke’a na zwycięstwo w meczu o mistrzostwo. To było zwycięstwo od tyłu dla mojej drabinki, awansując z 14. miejsca na 7. na 1.… w ciągu trzech ostatnich meczów w 63-meczowym turnieju.
Ale czy powinienem był wygrać? W naszej puli zastosowano wspólny system punktacji w nawiasach:
- 1 punkt za każdy prawidłowy wybór w pierwszej rundzie 64 drużyn,
- 2 punkty za każdy prawidłowy wybór w druga runda 32 drużyn,
- 4 punkty za każdy prawidłowy wybór w trzeciej rundzie 16 drużyn,
- 8 punktów za każdy prawidłowy wybór w czwartej rundzie 8 drużyn,
- 16 punktów za każdy prawidłowy wybór w dwóch meczach Final Four,
- 32 punkty za prawidłowe wytypowanie mistrza.
Ten system „podwajania” ma kilka rozsądnych motywacji matematycznych. Na przykład każda runda gier jest potencjalnie warta taką samą liczbę punktów (32). Zakładając również, że wszystkie drużyny są równo dopasowane – lub równoważnie, zakładając, że wszystkie typy dokonujesz odwracając sprawiedliwy moneta – wtedy oczekiwana liczba zdobytych punktów zmniejsza się dokładnie o połowę z każdą rundą.
Ale zespoły nie są jednakowo dopasowane i nie wybierasz swoich wyborów, rzucając monetami. Intuicyjnie wydaje się, że jak to zrobić System ublingu może przeceniać znaczenie późniejszych rund, a być może lepszy system oznacza mniej ekstremalny wzrost punktów na grę z jednej rundy do drugiej. Jedną z bardziej zabawnych wspólnych sugestii jest progresja oparta na sekwencji Fibonacciego, w której gry w każdej rundzie warte są odpowiednio 2, 3, 5, 8, 13 i 21 punktów. Moim celem w tym poście jest opisanie sposobów dokładniejszej oceny i porównania tych i innych systemów punktacji drabinkowej.
Model prawdopodobieństwa dla gier turniejowych
Najpierw musimy modelować prawdopodobieństwo prawidłowego wybrania określonej gry. Dość prostym punktem wyjścia jest założenie, że wszystkie mecze są niezależne, a prawdopodobieństwo każdego wyniku zależy tylko od rozstawienia drużyn. Dokładniej, niech P będzie macierzą 16 × 16 z pozycjami
wskazującymi prawdopodobieństwo, że ziarno i pokonuje ziarno j, gdzie jest pewną miarą „siły” ziarna i (malejącą w i), a k jest współczynnik skalujący, który skutecznie określa zakres wynikowych prawdopodobieństw. Na przykład, jeśli, to każda gra jest rzutem monetą, z drugiej strony, jeśli, to szesnasty element siewny ma zerowe prawdopodobieństwo przewrotu w pierwszej rundzie względem pierwszego. W tej dyskusji k zostanie wybrane tak, aby
na podstawie obserwacji, że w 124 meczach w ciągu ostatnich 31 lat obecnego formatu turnieju, pierwsze miejsce nigdy nie przegrało z 16. miejscem To prawdopodobieństwo jest oczekiwaną wartością odpowiedniego rozkładu beta.
Rok temu użyłem prostej wersji tego modelu do oszacowania prawdopodobieństwa wybrania „przedziału idealnego”, czyli wybrania wszystkich 63 gry poprawnie, używając liniowej funkcji siły:
więc zależy to tylko od różnicy między nasionami. Nawet ten bardzo prosty model nie jest taki zły, jak pokazano na poniższym zaktualizowanym rysunku, z liniowym modelem prognozowania na czerwono i danymi historycznymi z ostatnich 31 lat przedstawionymi na niebiesko, z odpowiadającymi 95% przedziałami ufności na czarno. Jak sugerują często bardzo szerokie przedziały ufności, 31 lat to wciąż niewiele danych; na przykład było tylko 7 pojedynków między rozstawieniami różniącymi się 10: 1. vs 11. to rozdzielone 3-3, a jedno drugie miejsce wygrało z dwunastym.
Prawdopodobieństwo wygranej jako funkcja różnicy początkowej: oszacowanie punktowe (kolor niebieski), przedział ufności 95% (kolor czarny) i model predykcji liniowej (kolor czerwony).
Jak zwykle okazuje się, że nie nowy pomysł; Schwertman et. glin. (patrz Odnośniki na końcu tego posta) rozważali ten sam model w 1991 roku, a także inną nieliniową funkcję siły, która okazała się lepiej pasować do historii:
gdzie jest funkcja kwantylowa rozkład normalny, czyli łączna liczba męskich drużyn koszykówki I ligi. Pomysł polega na tym, że „mocne strony” wszystkich drużyn są normalnie rozłożone, przy czym 64 drużyny w turnieju obejmują „najsilniejsze” drużyny w górnej części tego rozkładu. Będę używał tej funkcji siły do końca tej dyskusji.
Obliczanie prawdopodobieństw prawidłowych typów
Biorąc pod uwagę dowolną macierz P prawdopodobieństw, którą wybierzemy, możemy użyć jej do obliczenia wynikowego rozkładu nasion wygrywających w danej grze w turnieju. Jeśli i są 16-elementowymi wektorami kolumnowymi z () wskazującymi prawdopodobieństwo, że drużyna gospodarzy (gości) w konkretnej grze jest rozstawiona i, to rozkład rozstawienia wygrywającego w tej grze jest określony wzorem
gdzie jest produkt Hadamarda pod względem elementów.W pierwszej rundzie każdy i jest wektorem bazowym. Zauważ, że uwzględnienie obu terminów w sumowaniu jest tak naprawdę tylko wygodą obliczeniową, przynajmniej w obrębie regionu, ponieważ dla danego ziarna tylko jeden z odpowiadających mu składników będzie różny od zera.
By stosując tę formułę iteracyjnie dla każdej gry w każdej kolejnej rundzie, możemy ostatecznie obliczyć prawdopodobieństwo wygrania każdego ziarna w każdej grze w turnieju. Na przykład poniższy kod Pythona oblicza rozkład zwycięzcy któregokolwiek z czterech mistrzostw regionalnych (na 16 drużyn w każdym):
Wynikowe przewidywane prawdopodobieństwa są pokazane na poniższym rysunku na czerwono – przy użyciu normalna funkcja siły kwantylowej powyżej – w porównaniu z rzeczywistymi częstotliwościami zaznaczonymi na niebiesko.
Zwycięzca mistrzostw regionalnych: rzeczywista częstotliwość (niebieski) i przewidywane prawdopodobieństwo (czerwony).
Systemy punktacji drabinkowej
Teraz, gdy mamy już sposób na obliczenie prawdopodobieństwa zwycięstwa określonej drużyny w jakimkolwiek konkretnym meczu, możemy ocenić zakończoną drabinkę, obliczając spodziewaną liczbę prawidłowych typów w każdej rundzie. Na przykład załóżmy, że nasz przedział po prostu wybiera faworyta (tj. Wyższego gracza), aby wygrać każdą grę. Wtedy oczekiwana liczba prawidłowych typów będzie wynosić:
- 23,156 z 32 gier w pierwszej rundzie,
- 9,847 z 16 gier w drugiej rundzie,
- 4,292 z 8 gier w trzeciej rundzie,
- 1,792 z 4 meczów w czwartej rundzie mistrzostw regionalnych,
- 0,540 z 2 meczów w Final Four,
- 0,156 ostatniego meczu o mistrzostwo.
W tym miejscu możemy porównać różne systemy punktacji drabinek, porównując oczekiwaną liczbę punktów zdobytych w każdej rundzie przy użyciu tych systemów. Na przykład poniższa tabela przedstawia oczekiwane punkty na rundę dla dwóch wspomnianych dotychczas systemów: systemu podwajania (1, 2, 4, 8, 16, 32) i systemu Fibonacciego (2, 3, 5, 8, 13 , 21), znormalizowany do 1 punktu za grę w pierwszej rundzie.
Który z tych lub innych systemów jest „najlepszy”, zależy od tego, jaką pulę chcesz. Z systemem podwajania (lub nawet większych progresji ), możesz mieć „ekscytującą” pulę wyścigów konnych, ze zmianami prowadzenia i wieloma wejściami, które mają szansę na wygraną we wszystkich sześciu rundach. Dzięki systemowi Fibonacciego (lub nawet bardziej stopniowym progresjom) możesz mieć pulę, która nagradza badania i dokładne przewidywanie problemów we wczesnej rundzie… ale taka pula może zostać skutecznie pokonana na długo przed Final Four.
Dodatek: Dane historyczne
Poniższe macierze zawierają zapis wszystkich zwycięstw i porażek, według zestawień rund i rozstawienia, dla 31 turniejów w obecnym formacie od 1985 do 2015. Najpierw następujące 16 × Macierz 16 wskazuje liczbę gier regionalnych – czyli w rundach od pierwszej do czwartej – w których rozstawienie wygrywa z rozstawieniem j. Zwróć uwagę, że runda, w której rozegrano każdą grę, jest również niejawnie określana przez mecz początkowy (np. 1 vs 16 jest w pierwszej rundzie itd.).
0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Poniższa macierz, w tym samym formacie, dotyczy gier Final Four (piąta runda):
12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
I na koniec dla meczów o mistrzostwo: