Cotele și cotele sunt o măsură importantă a șansei absolute / relative de a se întâmpla un eveniment de interes, dar interpretarea lor este uneori un pic dificil de stăpânit. În această scurtă postare, voi descrie aceste concepte într-un mod (sperăm) clar.
De la probabilitate la cote
Punctul nostru de plecare este acela de a folosi probabilitatea pentru a exprima șansa că un eveniment de interes apare. Deci, o probabilitate de 0,1 sau 10% risc, înseamnă că există o șansă de 1 din 10 să se producă evenimentul. Modul obișnuit de a gândi probabilitatea este că, dacă am putea repeta experimentul sau procesul în cauză de multe ori, fracțiunea de experimente în care are loc evenimentul ar trebui să fie aproape de probabilitate (de exemplu, 0,1).
Cote și jocuri de noroc fracționale
În special în lumea jocurilor de noroc, cotele sunt uneori exprimate ca fracții, pentru a ușura calculele mentale. De exemplu, cota de la 9 la 1 împotriva, spusă ca „nouă la unu împotriva” și scrisă ca 9/1 sau 9: 1, înseamnă că evenimentul de interes va fi apare o dată la fiecare 9 ori când evenimentul nu are loc. Adică în 10 ori / replicări, ne așteptăm ca evenimentul de interes să se întâmple o dată și t evenimentul să nu se întâmple în celelalte 9 ori. Folosirea cotelor pentru a exprima probabilitățile este utilă într-un cadru de jocuri de noroc, deoarece permite cu ușurință să calculăm cât ar câștiga cineva – cu cota 9/1 veți câștiga 9 pentru un pariu de 1 (presupunând că pariul dvs. este bun!).
Rapoartele de probabilități
În statistici, raporturile de probabilități la nivel mondial sunt frecvent utilizate pentru a exprima șansa relativă ca un eveniment să se întâmple în două condiții diferite. De exemplu, în contextul unui studiu clinic care compară un tratament existent cu un tratament nou, putem compara șansele de a experimenta un rezultat rău dacă un pacient ia noul tratament cu șansele de a experimenta un rezultat rău dacă un pacient ia tratament existent.
Să presupunem că probabilitatea unui rezultat rău este de 0,2 dacă un pacient ia tratamentul existent, dar că acesta este redus la 0,1 dacă ia noul tratament. Cotele unui rezultat negativ cu tratamentul existent sunt de 0,2 / 0,8 = 0,25, în timp ce cotele pentru noul tratament sunt de 0,1 / 0,9 = 0,111 (recurent). Raportul de cote care compară noul tratament cu vechiul tratament este apoi pur și simplu raportul de cote corespunzător: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (recurent). Aceasta înseamnă că șansele unui rezultat neplăcut dacă un pacient ia noul tratament sunt 0,444 cele ale șanselor unui rezultat neplăcut dacă iau tratamentul existent. Cotele (și, prin urmare, probabilitatea) unui rezultat negativ sunt reduse prin luarea noului tratament. De asemenea, am putea exprima reducerea spunând că șansele sunt reduse cu aproximativ 56%, deoarece șansele sunt reduse cu un factor de 0,444.
De ce raporturile de probabilitate și nu raporturile de risc / probabilitate?
Oamenii găsesc adesea (cred destul de înțeles) cote și, prin urmare, un raport de cote, dificil de interpretat intuitiv. O alternativă este calcularea raporturilor de risc sau probabilitate. În exemplul studiului clinic, raportul risc (probabilitate de citire) este pur și simplu raportul dintre probabilitatea unui rezultat negativ sub noul tratament și probabilitatea sub tratamentul existent, adică 0,1 / 0,2 = 0,5. Acest lucru înseamnă că riscul unui rezultat nefavorabil cu noul tratament este la jumătate decât în cazul tratamentului existent sau, alternativ, riscul este redus la jumătate. Intuitiv, raportul de risc este mult mai ușor de înțeles. Deci, de ce folosim cote și raporturi de cote în statistici?
Regresie logistică
Deseori vrem să facem mai mult decât să comparăm două grupuri în ceea ce privește probabilitatea / riscul / cotele unei rezultat. În mod specific, suntem deseori interesați de adaptarea modelelor statistice care descriu modul în care șansa evenimentului de interes care depinde de o serie de covariabile sau predictori. Astfel de modele pot fi încadrate în familia de modele liniare generalizate. Cel mai popular model este regresia logistică, care folosește funcția de legătură logit. Această alegere a funcției de legătură înseamnă că parametrii modelului montat sunt rapoarte de probabilități ale jurnalului, care în software sunt de obicei exponențiate și raportate ca rapoarte de probabilități. Funcția de legătură logit este utilizată deoarece pentru un rezultat binar este așa-numita funcție de legătură canonică, care, fără a intra în detalii suplimentare, înseamnă că are anumite proprietăți favorabile. În consecință, atunci când potrivim modele pentru rezultate binare, dacă folosim abordarea implicită a regresiei logistice, parametrii pe care îi estimăm sunt raporturile de probabilitate.
O alternativă la regresia logistică este utilizarea unui model de regresie a legăturii jurnal, care are ca rezultat (jurnal) parametrii raportului de risc. Din păcate, din punct de vedere istoric, acestea au suferit probleme numerice atunci când au încercat să le potrivească cu datele (a se vedea aici o lucrare despre aceasta).Cu toate acestea, există și o problemă mai fundamentală cu regresia legăturii jurnal, prin aceea că legătura jurnal înseamnă că anumite combinații de valori covariabile pot duce la probabilități potrivite în afara intervalului (0,1).
Studii de control de caz
În cazul studiilor de control, persoanele sunt selectate în studiu cu o probabilitate care depinde dacă au experimentat sau nu evenimentul de interes. Sunt deosebit de utile pentru studierea bolilor care apar rar. Un studiu de control al cazului ar putea (încerca să) înscrie pe toți cei care experimentează evenimentul de interes într-o anumită perioadă de timp, împreună cu o serie de „controale”, adică indivizi care nu au experimentat evenimentul de interes. Într-un studiu de control al cazurilor, proporția cazurilor este sub controlul investigatorului și, în special, proporția din studiu nu este reprezentativă pentru incidența populației țintă. Prin urmare, nu se poate estima raportul de risc sau risc din controlul cazului. studii, cel puțin nu fără informații suplimentare externe. Cu toate acestea, se pare că raportul de șanse poate fi în continuare valid estimat cu un design de control al cazurilor, datorită unei anumite proprietăți de simetrie posedată de raportul de șanse.
Rare rezultate
Când evenimentul de interes este rar (adică probabilitatea ca acesta să apară este scăzut), șansele și raporturile de risc sunt numerice destul de similare. Astfel, în situații cu rezultate rare, un raport de șanse poate fi interpretat ca și cum a fost un raport de risc, deoarece vor fi similare numeric. Cu toate acestea, atunci când rezultatul nu este rar, cele două măsuri pot fi substanțial diferite (a se vedea aici, de exemplu).