Odds e odds ratios são uma medida importante da chance absoluta / relativa de um evento de interesse acontecer, mas sua interpretação às vezes é um pouco complicado de dominar. Neste breve post, descreverei esses conceitos de uma maneira (espero) clara.
Da probabilidade às probabilidades
Nosso ponto de partida é usar a probabilidade para expressar a chance de que ocorre um evento de interesse. Portanto, uma probabilidade de 0,1, ou 10% de risco, significa que há 1 chance em 10 de o evento ocorrer. A maneira usual de pensar sobre a probabilidade é se pudermos repetir o experimento ou processo em consideração um grande número de vezes, a fração de experimentos em que o evento ocorre deve ser próxima da probabilidade (por exemplo, 0,1).
Probabilidades fracionais e jogos de azar
Particularmente no mundo dos jogos de azar, as probabilidades são às vezes expressas como frações, a fim de facilitar os cálculos mentais. Por exemplo, probabilidades de 9 para 1 contra, ditas como “nove para um contra” e escritas como 9/1 ou 9: 1, significa que o evento de interesse será ocorrem uma vez para cada 9 vezes em que o evento não ocorre. Ou seja, em 10 vezes / repetições, esperamos que o evento de interesse aconteça uma vez e t O evento não acontecerá nas outras 9 vezes. Usar probabilidades para expressar probabilidades é útil em um ambiente de jogo porque permite calcular quanto ganharia – com probabilidades de 9/1, você ganhará 9 para uma aposta de 1 (assumindo que sua aposta seja boa!).
Odds ratio
No mundo das estatísticas, os odds ratios são freqüentemente usados para expressar a chance relativa de um evento acontecer sob duas condições diferentes. Por exemplo, no contexto de um ensaio clínico comparando um tratamento existente a um novo tratamento, podemos comparar as chances de experimentar um resultado ruim se um paciente tomar o novo tratamento com as chances de experimentar um resultado ruim se um paciente tomar o tratamento existente.
Suponha que a probabilidade de um resultado ruim seja 0,2 se um paciente tomar o tratamento existente, mas que isso seja reduzido para 0,1 se ele fizer o novo tratamento. A chance de um resultado ruim com o tratamento existente é de 0,2 / 0,8 = 0,25, enquanto a chance do novo tratamento é de 0,1 / 0,9 = 0,111 (recorrente). A razão de chances comparando o novo tratamento com o antigo é simplesmente a razão de chances correspondente: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (recorrente). Isso significa que a chance de um resultado ruim se um paciente fizer o novo tratamento é de 0,444 do que a chance de um resultado ruim se ele fizer o tratamento existente. As chances (e, portanto, a probabilidade) de um resultado ruim são reduzidas com o novo tratamento. Também poderíamos expressar a redução dizendo que as chances são reduzidas em aproximadamente 56%, uma vez que as chances são reduzidas por um fator de 0,444.
Por que razões de chances, e não razões de risco / probabilidade?
As pessoas frequentemente (acho que é compreensível) consideram as probabilidades e, consequentemente, também uma razão de probabilidades, difíceis de interpretar intuitivamente. Uma alternativa é calcular taxas de risco ou probabilidade. No exemplo do ensaio clínico, a razão de risco (probabilidade de leitura) é simplesmente a razão entre a probabilidade de um resultado ruim no novo tratamento e a probabilidade no tratamento existente, ou seja, 0,1 / 0,2 = 0,5. Isso significa que o risco de um resultado ruim com o novo tratamento é metade do que ocorre com o tratamento existente ou, alternativamente, o risco é reduzido pela metade. Intuitivamente, a relação de risco é muito mais fácil de entender. Então, por que usamos odds e odds ratios em estatísticas?
Regressão logística
Freqüentemente, queremos fazer mais do que apenas comparar dois grupos em termos de probabilidade / risco / chance de um resultado. Especificamente, frequentemente estamos interessados em ajustar modelos estatísticos que descrevem como a chance de o evento de interesse ocorrer depende de uma série de covariáveis ou preditores. Esses modelos podem ser ajustados dentro da família de modelos lineares generalizados. O modelo mais popular é a regressão logística, que usa a função de link logit. Essa escolha de função de link significa que os parâmetros do modelo ajustado são odds ratios logarítmicos, que no software são geralmente exponenciados e relatados como odds ratios. A função de link logit é usada porque para um resultado binário é a chamada função de link canônico, que sem entrar em maiores detalhes, significa que tem certas propriedades favoráveis. Consequentemente, ao ajustar modelos para resultados binários, se usarmos a abordagem padrão de regressão logística, os parâmetros que estimamos são odds ratios.
Uma alternativa à regressão logística é usar um modelo de regressão de link de log, que resulta em (log) parâmetros de razão de risco. Infelizmente, historicamente, eles sofreram de problemas numéricos ao tentar ajustá-los aos dados (veja aqui um artigo sobre isso).No entanto, há também um problema mais fundamental com a regressão do link de log, em que o link de log significa que certas combinações de valores de covariável podem levar a probabilidades ajustadas fora do intervalo (0,1).
Estudos de controle de caso
Em estudos de caso-controle, os indivíduos são selecionados para o estudo com uma probabilidade que depende de terem vivenciado o evento de interesse ou não. Eles são particularmente úteis para estudar doenças que ocorrem raramente. Um estudo de caso-controle pode (tentar) inscrever todos aqueles que vivenciaram o evento de interesse em um determinado período de tempo, juntamente com uma série de “controles”, ou seja, indivíduos que não experimentaram o evento de interesse. Em um estudo de caso-controle, a proporção de casos está sob o controle do investigador e, em particular, a proporção no estudo não é representativa da incidência na população-alvo. Como consequência, não se pode estimar risco ou taxas de risco a partir do caso-controle. estudos, pelo menos não sem informações adicionais externas. No entanto, verifica-se que o odds ratio ainda pode ser validamente estimado com um projeto de controle de caso, devido a uma certa propriedade de simetria possuída pelo odds ratio.
Raro resultados
Quando o evento de interesse é raro (ou seja, a probabilidade de ocorrer é baixa), as chances e razões de risco são numericamente muito semelhantes. Assim, em situações com resultados raros, uma razão de chances pode ser interpretada como se era uma razão de risco, pois seriam numericamente semelhantes. Porém, quando o resultado não é raro, as duas medidas podem ser substancialmente diferentes (ver aqui, por exemplo).