はじめに
2015年NCAA男子バスケットボールトーナメントで、私は(1)当時無敗だったものを選んでオフィスプールを勝ち取りましたケンタッキーが負ける-ウィスコンシンへの実際のファイナルフォーの敗北よりも早いが-そして(2)チャンピオンシップゲームに勝つためにデュークを選ぶ。それは私のブラケットにとって逆転勝利であり、63ゲームトーナメントの最後の3ゲームのスパンで14位から7位から1位に移動しました。
しかし、私は勝つべきでしたか?私たちのプールは、割り当ての一般的なブラケットスコアリングシステムを使用しました:
- 64チームの最初のラウンドの正しいピックごとに1ポイント、
- の正しいピックごとに2ポイント32チームの第2ラウンド、
- 16チームの第3ラウンドの正しいピックごとに4ポイント
- 8チームの第4ラウンドの正しいピックごとに8ポイント
- ファイナルフォーの2試合で正しいピックごとに16ポイント、
- チャンピオンを正しくピックするために32ポイント。
li>
この「ダブリング」システムにはいくつかの合理的な数学的動機。たとえば、ゲームの各ラウンドは、同じポイント数(32)の価値がある可能性があります。また、すべてのチームが均等に一致していると仮定すると、または同等に、フェアを反転してすべてのピックを行うと仮定します。コイン–その後、得点の予想数はラウンドごとにちょうど半分に減少します。
しかし、チームは均等に一致しておらず、コインを弾いてピックを行うことはありません。直感的には、このようにユーブリングシステムは、後のラウンドの重要性を過大評価している可能性があり、おそらくより良いシステムでは、あるラウンドから次のラウンドへのゲームあたりのポイントの極端な増加が少なくなります。より面白い一般的な提案の1つは、フィボナッチ数列に基づく進行であり、各ラウンドのゲームはそれぞれ2、3、5、8、13、および21ポイントの価値があります。この投稿での私の目標は、これらおよび他のブラケットスコアリングシステムをより正確に評価および比較する方法を説明することです。
トーナメントゲームの確率モデル
まず、モデル化する方法が必要です。特定のゲームを正しく選択する確率。かなり単純な出発点は、すべてのゲームが独立しており、各結果の確率がチームのシードのみに依存していると想定することです。より正確には、Pを16×16の行列とし、エントリを含む
シードiがシードjを打ち負かす確率を示します。ここで、はシードiの「強度」(iで減少)の尺度であり、kは結果として生じる確率の範囲を効果的に決定するスケーリング係数。たとえば、の場合、すべてのゲームはコインフリップです。反対の極端な場合、の場合、16番目のシードは1番目のシードに対して最初のラウンドが混乱する確率がゼロです。このディスカッションでは、kは、
現在のトーナメント形式の過去31年間の124回の対戦で、1番目のシードが16番目に失われたことがないという観察に基づいて選択されます。シード。この確率は、対応するベータ分布の期待値です。
1年前にこのモデルの単純なバージョンを使用して、「完全なブラケット」を選択する確率、つまり63個すべてを選択する確率を推定しました。線形強度関数を使用して、ゲームを正しく行います。
これは、シード間の違いのみに依存します。この非常に単純なモデルでさえ、次の更新された図に示すように、それほど悪くはありません。線形予測モデルは赤で、過去31年間の履歴データは青で示され、対応する95%信頼区間は黒で示されています。多くの場合非常に広い信頼区間が示唆するように、31年はまだ多くのデータではありません。たとえば、シード間で10が異なる7つの対戦しかありませんでした。1番目と11番目は3-3に分割され、1つの2番目のシードが12番目に勝ちました。
勝つ確率シード差の関数として:点推定(青)、95%信頼区間(黒)、線形予測モデル(赤)。
いつものように、これはそうではなかったことがわかります。新しいアイデア。 Schwertmanet。 al。 (この投稿の最後にある参考文献を参照)1991年にこの同じモデルと、より良い歴史的適合であることが判明した別の非線形強度関数を検討しました。
ここで、の分位関数は正規分布であり、ディビジョンIの男子バスケットボールチームの総数です。アイデアは、すべてのチームの「強さ」が正規分布しており、トーナメントの64チームが、この分布の上部テールにある「最強」のチームで構成されているというものです。この説明の残りの部分では、この強度関数を使用します。
正しいピックの確率の計算
選択した確率の行列Pが与えられた場合、それを使用して結果の分布を計算できます。トーナメントで特定のゲームに勝ったシードのおよびが16要素の列ベクトルであり、()が特定のゲームのホーム(訪問)チームにシードされる確率iを示す場合、そのゲームに勝つシードの分布は次の式で与えられます。
ここで、要素ごとのアダマール積。最初のラウンドでは、それぞれとは基底ベクトルです。与えられたシードに対して、2つの項の対応するコンポーネントの1つだけがゼロ以外になるため、合計に両方の項を含めることは、少なくとも領域内では、実際には計算上の便宜にすぎないことに注意してください。
Byこの式を連続する各ラウンドの各ゲームに繰り返し適用すると、最終的に、各シードがトーナメントの各ゲームに勝つ確率を計算できます。たとえば、次のPythonコードは、4つの地域チャンピオンシップのいずれかの勝者の分布を計算します(各16チーム間)。
結果の予測確率は、次の図に赤で示されています。上記の通常の分位強度関数–青の実際の頻度と比較。
地域選手権の勝者:実際の頻度(青)と予測確率(赤)。
ブラケットスコアリングシステム
特定のチームが特定のゲームに勝つ確率を計算する手段ができたので、各ラウンドで予想される正しいピックの数を計算することで、完成したブラケットを評価できます。たとえば、ブラケットがすべてのゲームに勝つために単にお気に入り(つまり、より高いシード)を選択するとします。その場合、正しいピックの予想数は次のようになります。
- 第1ラウンドの32ゲーム中23.156、
- 第2ラウンドの16ゲーム中9.847
- 第3ラウンドの8試合中4.292、
- 第4ラウンドの地域選手権の4試合中1.792
- ファイナルフォーの2試合中0.540
- 最終チャンピオンシップゲームの0.156。
この時点で、さまざまなブラケットスコアリングシステムを使用して、各ラウンドで得点されると予想されるポイント数を比較することで、それらのシステムを比較できます。たとえば、次の表は、これまでに説明した2つのシステム(ダブリングシステム(1、2、4、8、16、32)とフィボナッチシステム(2、3、5、8、13))のラウンドあたりの予想ポイントを示しています。 、21)、最初のラウンドのゲームごとに1ポイントに正規化されます。
これらのシステムまたは他のシステムのどちらが「最適」かは、必要なプールの種類によって異なります。ダブリングシステム(またはさらに大きな進行)を使用する場合)、あなたは「エキサイティングな」競馬風のプールを持つことができ、リードの変更と複数のエントリーが6ラウンドすべてを通して勝つチャンスがあります。フィボナッチシステム(またはさらに段階的な進行)を使用すると、研究と早期ラウンドの混乱の正確な予測に報いるプールを持つことができます…しかし、そのようなプールはファイナルフォーのかなり前に効果的に終わっている可能性があります。
付録:履歴データ
次のマトリックスには、1985年から2015年までの現在の形式の31のトーナメントについて、ラウンドとシードの対戦によるすべての勝ち負けの記録が含まれています。 16マトリックスは、シードiがシードjを打ち負かした地域ゲームの数(つまり、第1ラウンドから第4ラウンド)を示します。各ゲームがプレイされたラウンドもシードマッチアップによって暗黙的に決定されることに注意してください(たとえば、1対16は最初のラウンドにあります)。
0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
次のマトリックスは、同じ形式で、(第5ラウンド)ファイナルフォーゲーム用です:
12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
そして最後にチャンピオンシップゲーム用です: