소개
2015 NCAA 남자 농구 토너먼트에서 저는 당시 무패를 뽑아서 사무실 풀에서 우승했습니다. 켄터키의 패배-비록 위스콘신에 대한 실제 파이널 4 패배보다 빠르지 만-그리고 (2) 챔피언십 게임에서 승리하기 위해 듀크를 선택. 63 경기 토너먼트에서 지난 3 경기 동안 14 위에서 7 위로 1 위로 옮겨 간 대진표의 역전 승리였습니다.
하지만 내가 이겼어야하나요? 우리 풀은 공통 대진표 배정 시스템을 사용했습니다.
- 64 개 팀의 첫 번째 라운드에서 정답마다 1 점,
- 32 개 팀의 2 라운드
- 16 개 팀의 3 라운드에서 정답마다 4 점,
- 8 개 팀의 4 라운드에서 정답마다 8 점
- 두 파이널 포 경기에서 정답을 맞출 때마다 16 점,
- 올바른 챔피언을 고르면 32 점.
li>
이 “배가”시스템은 몇 가지 합리적인 수학적 동기. 예를 들어, 각 게임 라운드는 잠재적으로 동일한 점수 (32 점)의 가치가 있습니다. 또한 모든 팀이 균등하게 일치한다고 가정하거나 공정을 뒤집어 모든 선택을한다고 가정합니다. coin– 그러면 예상되는 득점 점수가 각 라운드마다 정확히 절반으로 감소합니다.
그러나 팀은 균등하게 일치하지 않으며 동전을 뒤집어서 골라 내지 않습니다. 이렇게 ubling 시스템은 이후 라운드의 중요성을 과도하게 강조 할 수 있으며, 아마도 더 나은 시스템은 한 라운드에서 다음 라운드로 게임당 점수가 덜 극단적으로 증가하는 것을 포함합니다. 더 재미있는 일반적인 제안 중 하나는 피보나치 수열을 기반으로 한 진행으로, 각 라운드의 게임은 각각 2, 3, 5, 8, 13 및 21 포인트의 가치가 있습니다. 이 게시물에서 저의 목표는 이들 및 기타 대진표 점수 시스템을보다 정확하게 평가하고 비교하는 방법을 설명하는 것입니다.
토너먼트 게임의 확률 모델
우선 모델링 방법이 필요합니다. 특정 게임을 올바르게 선택할 확률. 합리적으로 간단한 시작점은 모든 게임이 독립적이고 각 결과의 확률은 팀의 시드에만 의존한다고 가정하는 것입니다. 더 정확하게는 P를 항목이있는 16×16 행렬이라고합시다
시드 i가 시드 j를 이길 확률을 나타냅니다. 여기서 시드 i의 “강도”(i에서 감소)의 일부 척도가이고 k는 결과 확률의 범위를 효과적으로 결정하는 스케일링 계수입니다. 예를 들어이면 모든 게임은 동전 던지기이고, 다른 극단에서는 16 번째 시드가 1 차 시드에 대해 1 라운드 당황 할 확률이 0입니다. 이 토론을 위해 k가 선택 될 것입니다.
현재 토너먼트 형식의 지난 31 년 동안 124 번의 매치업에서 1 번째 시드가 지금까지 16 위로 패한 적이 없다는 관찰을 바탕으로 이 확률은 해당 베타 분포의 예상 값입니다.
1 년 전에이 모델의 간단한 버전을 사용하여 “완벽한 브래킷”을 선택할 확률, 즉 63 개를 모두 선택했습니다. 선형 강도 함수를 사용하여 게임을 올바르게 :
그래야 시드 간의 차이에만 의존합니다. 다음 업데이트 된 그림에서 볼 수 있듯이이 매우 단순한 모델조차도 빨간색으로 선형 예측 모델이 표시되고 최근 31 년의 과거 데이터가 파란색으로 표시되며 95 % 신뢰 구간이 검은 색으로 표시됩니다. 종종 매우 넓은 신뢰 구간에서 알 수 있듯이 31 년은 여전히 많은 데이터가 아닙니다. 예를 들어, 시드간에 10이 다른 7 번의 매치업 만있었습니다. 1 위와 11 위는 3-3으로 나뉘고 단일 두 번째 시드는 12 위에 이겼습니다.
승리 확률 시드 차이의 함수로 : 포인트 추정 (파란색), 95 % 신뢰 구간 (검은 색) 및 선형 예측 모델 (빨간색).
평상시처럼 이것은 그렇지 않은 것으로 나타났습니다. 새로운 아이디어; Schwertman et. al. (이 게시물 끝에있는 참조 참조) 1991 년에 동일한 모델과 더 나은 역사적 적합으로 판명 된 또 다른 비선형 강도 함수를 고려했습니다.
정규 분포이며 Division I 남자 농구 팀의 총 수입니다. 아이디어는 모든 팀의 “강점”이 정상적으로 분포되어 있으며 토너먼트의 64 개 팀이이 분포의 상단 꼬리 부분에있는 “가장 강력한”팀으로 구성된다는 것입니다. 이 논의의 나머지 부분에서이 강도 함수를 사용할 것입니다.
올바른 선택 확률 계산
우리가 선택한 확률 행렬 P가 주어지면 결과 분포를 계산하는 데 사용할 수 있습니다. 토너먼트의 특정 게임에서이기는 시드의 특정 게임의 홈 (방문) 팀이 시드를받을 확률을 나타내는 ()가있는 16 개 요소 열 벡터 인 경우 해당 게임에서 승리 한 시드 분포는 다음과 같습니다.
요소 별 Hadamard 제품.첫 번째 라운드에서 각각 및는 기저 벡터입니다. 합산에 두 용어를 모두 포함하는 것은 주어진 시드에 대해 두 용어의 해당 구성 요소 중 하나만 0이 아니기 때문에 적어도 영역 내에서 계산상의 편의 일뿐입니다.
By 이 공식을 각 연속 라운드의 각 게임에 대해 반복적으로 적용하면 토너먼트의 각 게임에서 각 시드가 승리 할 확률을 결국 계산할 수 있습니다. 예를 들어, 다음 Python 코드는 4 개의 지역 챔피언십 중 하나의 우승자의 분포를 계산합니다 (각각 16 개 팀).
결과 예측 확률은 다음 그림에 빨간색으로 표시됩니다. 위의 정상 분위수 강도 함수 – 파란색으로 표시된 실제 빈도와 비교됩니다.
지역 챔피언십 우승자 : 실제 빈도 (파란색) 및 예측 확률 (빨간색)
브라켓 채점 시스템
이제 특정 팀이 특정 게임에서 이길 확률을 계산할 수 있으므로 각 라운드에서 예상되는 올바른 픽 수를 계산하여 완료된 브래킷을 평가할 수 있습니다. 예를 들어, 우리 대진이 모든 게임에서 승리하기 위해 단순히 좋아하는 (즉, 더 높은 시드)를 선택한다고 가정합니다. 예상되는 정확한 픽 수는 다음과 같습니다.
- 1 라운드 32 경기 중 23.156,
- 두 번째 라운드 16 경기 중 9.847
- 3 라운드 8 경기 중 4.292,
- 4 라운드 지역 챔피언십 4 경기 중 1.792,
- 파이널 4 경기 2 경기 중 0.540
- 최종 챔피언십 게임의 0.156.
이 시점에서 각 라운드에서 획득 한 예상 점수를 해당 시스템을 사용하여 비교하여 다양한 대진표 점수 시스템을 비교할 수 있습니다. 예를 들어, 다음 표는 지금까지 언급 한 두 시스템에 대한 라운드 당 예상 포인트를 보여줍니다 : 더블링 시스템 (1, 2, 4, 8, 16, 32)과 피보나치 시스템 (2, 3, 5, 8, 13) , 21), 1 라운드 게임당 1 점으로 정규화되었습니다.
어떤 시스템이 “최고”인지는 원하는 풀의 종류에 따라 달라집니다. ), “흥미로운”경마와 같은 풀을 가질 수 있으며, 리드가 변경되고 6 라운드 모두에서 승리 할 수있는 여러 항목이 있습니다. 피보나치 시스템 (또는 훨씬 더 점진적인 진행)을 사용하면 연구에 대한 보상을 제공하고 초기 라운드의 혼란을 정확하게 예측할 수있는 풀을 가질 수 있습니다.하지만 이러한 풀은 파이널 4 이전에 효과적으로 끝날 수 있습니다.
부록 : 과거 데이터
다음 매트릭스에는 1985 년부터 2015 년까지 현재 형식의 31 개 토너먼트에 대한 라운드 및 시드 매치업 별 모든 승패 기록이 포함되어 있습니다. 첫째, 다음 16 배 16 매트릭스는 시드 i가 시드 j를이기는 지역 게임의 수를 나타냅니다. 즉, 1 라운드부터 4 라운드까지. 각 게임이 진행된 라운드도 시드 매치업에 의해 암시 적으로 결정됩니다 (예 : 1 대 16이 첫 번째 라운드에 있음).
0 21 13 32 30 6 4 51 56 4 3 19 4 0 0 124 21 0 23 2 0 23 53 2 0 26 12 1 0 0 117 0 8 14 0 2 2 38 7 1 1 9 25 0 0 104 1 0 15 4 3 0 36 2 2 3 2 2 0 21 99 0 0 0 7 3 1 30 0 1 0 0 1 1 0 80 11 0 0 0 2 6 28 1 0 0 3 0 0 4 81 0 0 13 0 0 0 20 5 2 0 3 0 0 0 76 0 0 0 1 2 0 12 3 0 5 2 1 1 0 63 0 0 0 1 0 0 0 5 1 0 0 1 0 0 61 0 0 0 0 1 0 0 0 0 18 4 0 0 2 48 0 0 0 0 0 0 1 4 0 3 1 13 0 0 43 3 0 0 2 0 0 0 5 0 0 0 0 0 12 44 0 0 1 0 0 0 0 8 0 0 0 0 0 0 25 3 0 0 0 0 0 0 3 0 0 0 0 0 0 20 0 0 2 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
다음 매트릭스는 같은 형식으로 (5 라운드) 파이널 4 게임용입니다.
12 6 2 5 1 0 1 1 1 0 0 0 0 0 0 0 4 2 3 1 0 1 0 0 0 0 1 0 0 0 0 0 4 2 0 2 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
마지막으로 챔피언십 게임용 :
p>