Odds e odds ratio sono una misura importante della possibilità assoluta / relativa che si verifichi un evento di interesse, ma la loro interpretazione è a volte un po ‘complicato da padroneggiare. In questo breve post descriverò questi concetti in modo (si spera) chiaro.
Dalla probabilità alle probabilità
Il nostro punto di partenza è quello di usare la probabilità per esprimere la possibilità che si verifica un evento di interesse. Quindi una probabilità di 0,1, o 10% di rischio, significa che c’è una probabilità su 10 che l’evento si verifichi. Il modo usuale di pensare alla probabilità è che se potessimo ripetere l’esperimento o il processo in esame un gran numero di volte, la frazione di esperimenti in cui si verifica l’evento dovrebbe essere vicina alla probabilità (ad es. 0,1).
Quote frazionarie e gioco d’azzardo
In particolare nel mondo del gioco d’azzardo, le probabilità sono talvolta espresse come frazioni, al fine di facilitare i calcoli mentali. Ad esempio, le probabilità di 9 a 1 contro, dette “nove a uno contro” e scritte come 9/1 o 9: 1, indicano che l’evento di interesse sarà si verificano una volta ogni 9 volte in cui l’evento non si verifica. Cioè in 10 volte / repliche, ci aspettiamo che l’evento di interesse accada una volta e t evento da non accadere nelle altre 9 volte. Usare le probabilità per esprimere le probabilità è utile in un contesto di gioco d’azzardo perché consente prontamente di calcolare quanto si vincerebbe: con una quota di 9/1 vincerai 9 per una scommessa di 1 (supponendo che la tua scommessa sia buona!).
Odds ratio
Nelle statistiche mondiali gli odds ratio sono spesso usati per esprimere la probabilità relativa che un evento si verifichi in due condizioni differenti. Ad esempio, nel contesto di una sperimentazione clinica che confronta un trattamento esistente con un nuovo trattamento, possiamo confrontare le probabilità di avere un esito negativo se un paziente prende il nuovo trattamento con le probabilità di sperimentare un esito negativo se un paziente prende il trattamento esistente.
Supponiamo che la probabilità di un esito negativo sia 0,2 se un paziente prende il trattamento esistente, ma che questa sia ridotta a 0,1 se prende il nuovo trattamento. Le probabilità di un esito negativo con il trattamento esistente sono 0,2 / 0,8 = 0,25, mentre le probabilità sul nuovo trattamento sono 0,1 / 0,9 = 0,111 (ricorrente). L’odds ratio che confronta il nuovo trattamento con il vecchio trattamento è quindi semplicemente il corrispondente rapporto di odds: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (ricorrente). Ciò significa che le probabilità di un esito negativo se un paziente prende il nuovo trattamento sono 0,444 rispetto alle probabilità di un esito negativo se prende il trattamento esistente. Le probabilità (e quindi la probabilità) di un esito negativo vengono ridotte assumendo il nuovo trattamento. Potremmo anche esprimere la riduzione dicendo che le probabilità sono ridotte di circa il 56%, poiché le probabilità sono ridotte di un fattore 0,444.
Perché gli odds ratio e non i rapporti rischio / probabilità?
Le persone spesso (penso abbastanza comprensibilmente) trovano le probabilità, e di conseguenza anche un rapporto di probabilità, difficili da interpretare intuitivamente. Un’alternativa è calcolare i rapporti di rischio o di probabilità. Nell’esempio della sperimentazione clinica, il rapporto di rischio (probabilità di lettura) è semplicemente il rapporto tra la probabilità di un esito negativo con il nuovo trattamento e la probabilità con il trattamento esistente, ovvero 0,1 / 0,2 = 0,5. Ciò significa che il rischio di un esito negativo con il nuovo trattamento è la metà di quello con il trattamento esistente, o in alternativa il rischio è ridotto della metà. Intuitivamente il rapporto di rischio è molto più facile da capire. Allora perché usiamo odds e odds ratio nelle statistiche?
Regressione logistica
Spesso vogliamo fare di più che confrontare due gruppi in termini di probabilità / rischio / odds di un risultato. In particolare, siamo spesso interessati ad adattare modelli statistici che descrivono come la probabilità che l’evento di interesse si verifichi dipende da un numero di covariate o predittori. Tali modelli possono essere adattati all’interno della famiglia di modelli lineari generalizzati. Il modello più popolare è la regressione logistica, che utilizza la funzione di collegamento logit. Questa scelta della funzione di collegamento significa che i parametri del modello adattato sono rapporti odds log, che nel software sono solitamente esponenziati e riportati come rapporti odds. La funzione di collegamento logit viene utilizzata perché per un risultato binario è la cosiddetta funzione di collegamento canonico, che senza entrare in ulteriori dettagli, significa che ha alcune proprietà favorevoli. Di conseguenza, quando si adattano i modelli per risultati binari, se usiamo l’approccio predefinito della regressione logistica, i parametri che stimiamo sono gli odds ratio.
Un’alternativa alla regressione logistica è usare un modello di regressione del collegamento logistico, che si traduce in (log) parametri del rapporto di rischio. Sfortunatamente storicamente questi hanno sofferto di problemi numerici quando hanno cercato di adattarli ai dati (vedi qui per un articolo su questo).Tuttavia, esiste anche un problema più fondamentale con la regressione del collegamento log, in quanto il collegamento log significa che alcune combinazioni di valori covariati possono portare a probabilità adattate al di fuori dell’intervallo (0,1).
Studi caso-controllo
Negli studi caso-controllo gli individui vengono selezionati nello studio con una probabilità che dipende dal fatto che abbiano sperimentato l’evento di interesse o meno. Sono particolarmente utili per studiare malattie che si verificano raramente. Uno studio caso-controllo potrebbe (tentare di) arruolare tutti coloro che sperimentano l’evento di interesse in un dato periodo di tempo, insieme a una serie di “controlli”, ovvero individui che non hanno vissuto l’evento di interesse. In uno studio caso-controllo la proporzione di casi è sotto il controllo dello sperimentatore, e in particolare la proporzione nello studio non è rappresentativa dell’incidenza nella popolazione target. Di conseguenza, non è possibile stimare il rischio o rapporti di rischio dal caso controllo studi, almeno non senza informazioni aggiuntive esterne. Tuttavia, risulta che l’odds ratio può ancora essere validamente stimato con un design case control, a causa di una certa proprietà di simmetria posseduta dall’odds ratio.
Raro risultati
Quando l’evento di interesse è raro (cioè la probabilità che si verifichi è bassa), gli odds e i rapporti di rischio sono numericamente abbastanza simili. Pertanto, in situazioni con esiti rari un odds ratio può essere interpretato come se si trattava di un rapporto di rischio, poiché saranno numericamente simili. Tuttavia, quando il risultato non è raro, le due misure possono essere sostanzialmente diverse (vedi qui, ad esempio).