Les cotes et les rapports de cotes sont une mesure importante de la probabilité absolue / relative qu’un événement d’intérêt se produise, mais leur interprétation est parfois un peu difficile à maîtriser. Dans ce court article, je vais décrire ces concepts d’une manière (espérons-le) claire.
De la probabilité aux cotes
Notre point de départ est d’utiliser la probabilité pour exprimer la chance que un événement d’intérêt se produit. Ainsi, une probabilité de 0,1, ou 10% de risque, signifie qu’il y a 1 chance sur 10 que l’événement se produise. La façon habituelle de penser à la probabilité est que si nous pouvions répéter l’expérience ou le processus considéré un grand nombre de fois, la fraction d’expériences où l’événement se produit doit être proche de la probabilité (par exemple 0,1).
Cotes fractionnelles et jeux d’argent
En particulier dans le monde des jeux d’argent, Les cotes sont parfois exprimées sous forme de fractions, afin de faciliter les calculs mentaux. Par exemple, une cote de 9 contre 1 contre, dite « neuf contre un contre », et écrite comme 9/1 ou 9: 1, signifie que l’événement d’intérêt sera se produit une fois toutes les 9 fois que l’événement ne se produit pas. C’est-à-dire dans 10 fois / répétitions, nous prévoyons que l’événement d’intérêt se produira une fois et t L’événement ne doit pas se produire dans les 9 autres fois. Utiliser des cotes pour exprimer des probabilités est utile dans un contexte de jeu car cela permet facilement de calculer combien on gagnerait – avec une cote de 9/1, vous gagnerez 9 pour un pari de 1 (en supposant que votre pari soit bon!).
Rapports de cotes
Dans le monde des statistiques, les rapports de cotes sont fréquemment utilisés pour exprimer la probabilité relative qu’un événement se produise dans deux conditions différentes. Par exemple, dans le cadre d’un essai clinique comparant un traitement existant à un nouveau traitement, nous pouvons comparer les chances de connaître un mauvais résultat si un patient prend le nouveau traitement avec les chances de connaître un mauvais résultat si un patient prend le traitement existant.
Supposons que la probabilité d’un mauvais résultat est de 0,2 si un patient prend le traitement existant, mais qu’elle est réduite à 0,1 s’il prend le nouveau traitement. La probabilité d’un mauvais résultat avec le traitement existant est de 0,2 / 0,8 = 0,25, tandis que la probabilité du nouveau traitement est de 0,1 / 0,9 = 0,111 (récurrent). Le rapport de cotes comparant le nouveau traitement à l’ancien traitement est alors simplement le rapport de cotes correspondant: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (récurrent). Cela signifie que la probabilité d’un mauvais résultat si un patient prend le nouveau traitement est de 0,444 celle de la probabilité d’un mauvais résultat s’il prend le traitement existant. Les chances (et donc la probabilité) d’un mauvais résultat sont réduites en prenant le nouveau traitement. Nous pourrions également exprimer la réduction en disant que les cotes sont réduites d’environ 56%, puisque les cotes sont réduites d’un facteur de 0,444.
Pourquoi les odds ratios, et non les rapports risque / probabilité?
Les gens trouvent souvent (je pense tout à fait compréhensible) que les cotes, et par conséquent aussi un rapport de cotes, sont difficiles à interpréter intuitivement. Une alternative consiste à calculer les ratios de risque ou de probabilité. Dans l’exemple de l’essai clinique, le rapport de risque (probabilité de lecture) est simplement le rapport de la probabilité d’un mauvais résultat sous le nouveau traitement à la probabilité sous le traitement existant, soit 0,1 / 0,2 = 0,5. Cela signifie que le risque d’un mauvais résultat avec le nouveau traitement est la moitié de celui du traitement existant, ou bien le risque est réduit de moitié. Intuitivement, le ratio de risque est beaucoup plus facile à comprendre. Alors pourquoi utilisons-nous les odds et odds ratios dans les statistiques?
Régression logistique
Souvent, nous voulons faire plus que simplement comparer deux groupes en termes de probabilité / risque / cotes d’un résultat. Plus précisément, nous nous intéressons souvent à l’ajustement de modèles statistiques qui décrivent comment la probabilité que l’événement d’intérêt se produise dépend d’un certain nombre de covariables ou de prédicteurs. Ces modèles peuvent être ajustés dans la famille de modèles linéaires généralisés. Le modèle le plus populaire est la régression logistique, qui utilise la fonction de lien logit. Ce choix de la fonction de lien signifie que les paramètres du modèle ajusté sont des rapports de cotes log, qui dans le logiciel sont généralement exponentiels et rapportés sous forme de rapports de cotes. La fonction de lien logit est utilisée car pour un résultat binaire, il s’agit de la fonction de lien canonique, ce qui, sans entrer dans plus de détails, signifie qu’elle possède certaines propriétés favorables. Par conséquent, lors de l’ajustement de modèles pour des résultats binaires, si nous utilisons l’approche par défaut de la régression logistique, les paramètres que nous estimons sont des rapports de cotes.
Une alternative à la régression logistique consiste à utiliser un modèle de régression de lien log, qui se traduit par (log) paramètres du ratio de risque. Malheureusement, historiquement, ceux-ci ont souffert de problèmes numériques lors de la tentative de les adapter aux données (voir ici pour un article à ce sujet).Cependant, il existe également un problème plus fondamental avec la régression des liens log, en ce que le lien log signifie que certaines combinaisons de valeurs de covariables peuvent conduire à des probabilités ajustées en dehors de la plage (0,1).
Études de cas-témoins
Dans les études cas-témoins, les individus sont sélectionnés dans l’étude avec une probabilité qui dépend du fait qu’ils ont vécu l’événement d’intérêt ou non. Ils sont particulièrement utiles pour étudier les maladies qui surviennent rarement. Une étude cas-témoins pourrait (tenter de) recruter tous ceux qui ont vécu l’événement d’intérêt pendant une période donnée, ainsi qu’un certain nombre de «témoins», c’est-à-dire des individus qui n’ont pas vécu l’événement d’intérêt. Dans une étude cas-témoins, la proportion de cas est sous le contrôle de l’investigateur, et en particulier la proportion dans l’étude n’est pas représentative de l’incidence dans la population cible. Par conséquent, on ne peut pas estimer le risque ou les ratios de risque à partir de cas témoins. études, du moins pas sans informations supplémentaires externes. Cependant, il s’avère que le rapport de cotes peut toujours être valablement estimé avec un plan de contrôle de cas, en raison d’une certaine propriété de symétrie possédée par le rapport de cotes.
Rare
Lorsque l’événement d’intérêt est rare (c’est-à-dire que la probabilité qu’il se produise est faible), les odds et les ratios de risque sont numériquement assez similaires. Ainsi, dans les situations avec des résultats rares, un odds ratio peut être interprété comme si c’était un rapport de risque, car ils seront numériquement similaires. Cependant, lorsque le résultat n’est pas rare, les deux mesures peuvent être sensiblement différentes (voir ici, par exemple).