승산 및 승산 비는 관심 이벤트가 발생할 절대적 / 상대적 기회의 중요한 척도이지만 때때로 그 해석은 마스터하기가 조금 까다 롭습니다. 이 짧은 게시물에서는 이러한 개념을 (희망적으로) 명확하게 설명하겠습니다.
확률에서 확률로
우리의 출발점은 확률을 사용하여 기회를 표현하는 것입니다. 관심있는 이벤트가 발생합니다. 따라서 0.1 또는 10 % 위험의 확률은 이벤트가 발생할 확률이 10 분의 1이라는 것을 의미합니다. 확률에 대한 일반적인 사고 방식은 고려중인 실험이나 프로세스를 반복 할 수 있다면 대부분의 경우 이벤트가 발생하는 실험 비율은 확률에 가까워 야합니다 (예 : 0.1).
분할 확률 및 도박
특히 도박의 세계에서 승산은 때때로 정신적 계산을 용이하게하기 위해 분수로 표현됩니다. 예를 들어, “9 대 1 반대”라고 말하고 9/1 또는 9 : 1로 쓰여진 9 대 1 반대의 승률은 관심있는 이벤트가 이벤트가 발생하지 않는 9 회에 한 번 발생합니다. 즉, 10 회 / 복제에서 관심 이벤트가 한 번 발생하고 t 그는 다른 9 번에 일어나지 않는 사건. 확률을 사용하여 확률을 표현하는 것은 도박 설정에서 유용합니다. 왜냐하면 얼마나 많은 이길 수 있는지 쉽게 계산할 수 있기 때문입니다. 9/1의 확률로 1의 베팅에 대해 9를 이길 것입니다 (베팅이 좋다고 가정합니다!).
승산 비
통계 세계에서 승산 비는 두 가지 다른 조건에서 발생하는 이벤트의 상대적인 가능성을 나타내는 데 자주 사용됩니다. 예를 들어, 기존 치료와 새로운 치료를 비교하는 임상 시험의 맥락에서 환자가 새로운 치료를받는 경우 나쁜 결과를 경험할 확률과 환자가 새로운 치료를받는 경우 나쁜 결과를 경험할 확률을 비교할 수 있습니다. 기존 치료.
환자가 기존 치료를받는 경우 나쁜 결과의 확률이 0.2이지만 새로운 치료를받는 경우 0.1로 감소한다고 가정합니다. 기존 치료에 대한 나쁜 결과의 확률은 0.2 / 0.8 = 0.25이고 새로운 치료에 대한 확률은 0.1 / 0.9 = 0.111 (반복)입니다. 새 치료법과 이전 치료법을 비교하는 승산 비는 단순히 해당 승산 비 (0.1 / 0.9) / (0.2 / 0.8) = 0.111 / 0.25 = 0.444 (반복)입니다. 이는 환자가 새로운 치료를받을 경우 나쁜 결과가 나올 확률이 기존 치료를받는 경우 나쁜 결과가 나올 확률이 0.444라는 것을 의미합니다. 새로운 치료를 받으면 나쁜 결과의 확률 (따라서 확률)이 줄어 듭니다. 또한 배당률이 0.444 배로 감소하기 때문에 배당률이 약 56 % 감소한다고 말함으로써 감소를 표현할 수 있습니다.
왜 위험 / 확률 비율이 아니라 배당률 비율입니까?
사람들은 종종 (제 생각에는 이해할 만하다고 생각합니다) 승산을 발견하고 결과적으로 승산 비도 직관적으로 해석하기 어렵습니다. 대안은 위험 또는 확률 비율을 계산하는 것입니다. 임상 시험 예에서 위험 (읽기 확률) 비율은 단순히 새로운 치료에 따른 나쁜 결과의 확률과 기존 치료에 따른 확률의 비율, 즉 0.1 / 0.2 = 0.5입니다. 이는 새로운 치료법으로 인한 나쁜 결과의 위험이 기존 치료법에 비해 절반이거나 그렇지 않으면 위험이 절반으로 감소한다는 것을 의미합니다. 직관적으로 위험 비율은 이해하기 훨씬 쉽습니다. 그렇다면 통계에서 승산 비를 사용하는 이유는 무엇입니까?
로지스틱 회귀
종종 확률 / 위험 / 승산 측면에서 두 그룹을 비교하는 것 이상을 원합니다. 결과. 특히, 관심 이벤트가 발생할 가능성이 여러 공변량 또는 예측 변수에 따라 어떻게 달라지는 지 설명하는 통계 모델을 맞추는 데 관심이 있습니다. 이러한 모델은 일반화 된 선형 모델 제품군에 적합 할 수 있습니다. 가장 많이 사용되는 모델은 로짓 연결 함수를 사용하는 로지스틱 회귀입니다. 이 연결 함수 선택은 적합 모델 매개 변수가 로그 승산 비라는 것을 의미하며, 소프트웨어에서는 일반적으로 지수화되고 승산 비로보고됩니다. 로짓 링크 함수는 바이너리 결과의 경우 소위 표준 링크 함수이기 때문에 사용됩니다.이 함수는 더 자세히 설명하지 않고 특정 유리한 속성을 가지고 있음을 의미합니다. 결과적으로 이진 결과에 대한 모델을 피팅 할 때 로지스틱 회귀의 기본 접근 방식을 사용하는 경우 추정되는 매개 변수는 승산 비입니다.
로지스틱 회귀의 대안은 로그 링크 회귀 모델을 사용하는 것입니다. (로그) 위험 비율 매개 변수. 불행히도 역사적으로 이들은 데이터에 맞추려고 할 때 수치 문제로 어려움을 겪었습니다 (이에 대한 논문은 여기 참조).그러나 로그 링크 회귀에는 더 근본적인 문제가 있습니다. 로그 링크는 특정 공변량 값 조합이 (0,1) 범위를 벗어나 적합 확률로 이어질 수 있음을 의미합니다.
사례 제어 연구
사례 대조 연구에서 개인은 관심 이벤트를 경험했는지 여부에 따라 확률로 연구에 선택됩니다. 드물게 발생하는 질병을 연구하는 데 특히 유용합니다. 사례 통제 연구는 여러 “대조군”, 즉 관심있는 사건을 경험하지 않은 개인과 함께 주어진 기간 동안 관심 이벤트를 경험하는 모든 사람들을 등록 (시도) 할 수 있습니다. 사례 대조 연구에서 사례 비율은 조사자의 통제하에 있으며, 특히 연구의 비율은 대상 집단의 발생률을 나타내지 않습니다. 따라서 사례 대조에서 위험 또는 위험 비율을 추정 할 수 없습니다. 적어도 외부 추가 정보 없이는 아닙니다. 그러나 승산 비가 갖는 특정 대칭 속성으로 인해 케이스 제어 설계로 승산 비를 여전히 유효하게 추정 할 수 있습니다.
희귀 결과
관심 이벤트가 드문 경우 (즉, 발생 확률이 낮음) 승산 및 위험 비율이 수치 적으로 매우 유사합니다. 따라서 드문 결과가있는 상황에서 승산 비율은 다음과 같이 해석 될 수 있습니다. 수치 적으로 유사 할 것이기 때문에 위험 비율이었습니다. 그러나 결과가 드물지 않은 경우 두 측정 값이 상당히 다를 수 있습니다 (예 : 여기 참조).