Tolke odds og odds-forhold

Odds og odds-forhold er et viktig mål på den absolutte / relative sjansen for at en hendelse av interesse skal skje, men deres tolkning er noen ganger litt vanskelig å mestre. I dette korte innlegget vil jeg beskrive disse konseptene på en (forhåpentligvis) klar måte.

Fra sannsynlighet til odds

Vårt utgangspunkt er å bruke sannsynlighet for å uttrykke sjansen for at en hendelse av interesse oppstår. Så en sannsynlighet på 0,1, eller 10% risiko, betyr at det er 1 til 10 sjanse for at hendelsen skal skje. Den vanlige måten å tenke på sannsynligheten er at hvis vi kunne gjenta eksperimentet eller prosessen som ble vurdert et stort antall ganger, bør brøkdelen av eksperimenter der hendelsen inntreffer være nær sannsynligheten (f.eks. 0,1).

Fraksjonelle odds og gambling

Spesielt i spillverdenen, odds blir noen ganger uttrykt som brøker, for å lette mentale beregninger. For eksempel betyr odds 9 til 1 mot, sagt som «ni mot en mot», og skrevet som 9/1 eller 9: 1, at hendelsen av interesse vil forekommer en gang for hver 9. gang at hendelsen ikke skjer. Det vil si i 10 ganger / replikasjoner, vi forventer at hendelsen av interesse vil skje en gang og t hendelsen skulle ikke skje de andre 9 gangene. Å bruke odds for å uttrykke sannsynligheter er nyttig i en gamblinginnstilling fordi det lett lar en beregne hvor mye man vil vinne – med odds 9/1 vil du vinne 9 for et spill på 1 (forutsatt at innsatsen din blir god!).

Oddsforhold

I statistikken brukes sjanseforhold ofte for å uttrykke den relative sjansen for at en hendelse skjer under to forskjellige forhold. For eksempel, i sammenheng med en klinisk studie som sammenligner en eksisterende behandling med en ny behandling, kan vi sammenligne oddsen for å oppleve et dårlig resultat hvis en pasient tar den nye behandlingen med oddsen for å oppleve et dårlig resultat hvis en pasient tar eksisterende behandling.

Anta at sannsynligheten for dårlig utfall er 0,2 hvis en pasient tar den eksisterende behandlingen, men at denne reduseres til 0,1 hvis de tar den nye behandlingen. Oddsen for et dårlig utfall med eksisterende behandling er 0,2 / 0,8 = 0,25, mens oddsen på den nye behandlingen er 0,1 / 0,9 = 0,111 (gjentakende). Oddsforholdet som sammenligner den nye behandlingen med den gamle behandlingen er da ganske enkelt det korresponderende forholdet mellom odds: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (tilbakevendende). Dette betyr at oddsen for et dårlig resultat hvis en pasient tar den nye behandlingen, er 0.444 den for oddsen for et dårlig resultat hvis de tar den eksisterende behandlingen. Oddsen (og dermed sannsynligheten) for et dårlig resultat reduseres ved å ta den nye behandlingen. Vi kan også uttrykke reduksjonen ved å si at oddsen reduseres med omtrent 56%, siden oddsen reduseres med en faktor på 0.444.

Hvorfor oddsforhold, og ikke risiko / sannsynlighetsforhold?

Folk finner ofte (tror jeg ganske forståelig) odds, og følgelig også et oddsforhold, vanskelig å tolke intuitivt. Et alternativ er å beregne risiko- eller sannsynlighetsforhold. I eksemplet med klinisk utprøving er forholdet mellom risiko (les sannsynlighet) ganske enkelt forholdet mellom sannsynligheten for et dårlig utfall under den nye behandlingen og sannsynligheten under den eksisterende behandlingen, dvs. 0,1 / 0,2 = 0,5. Dette betyr at risikoen for et dårlig utfall med den nye behandlingen er halvparten av den under den eksisterende behandlingen, eller alternativt reduseres risikoen med en halv. Intuitivt er risikoforholdet mye lettere å forstå. Så hvorfor bruker vi odds og oddsforhold i statistikk?

Logistisk regresjon

Ofte ønsker vi å gjøre mer enn bare å sammenligne to grupper når det gjelder sannsynlighet / risiko / odds for en utfall. Spesielt er vi ofte interessert i å tilpasse statistiske modeller som beskriver hvordan sjansen for at hendelsen av interesse oppstår avhenger av et antall kovariater eller prediktorer. Slike modeller kan monteres i den generelle lineære modellfamilien. Den mest populære modellen er logistisk regresjon, som bruker logit link-funksjonen. Dette valget av lenkefunksjon betyr at de tilpassede modellparametrene er loggoddsforhold, som i programvare vanligvis eksponentieres og rapporteres som oddsforhold. Logit link-funksjonen brukes fordi det for et binært utfall er den såkalte kanoniske lenkefunksjonen, som uten å gå i nærmere detaljer betyr at den har visse gunstige egenskaper. Følgelig når vi bruker modeller for binære utfall, hvis vi bruker standard tilnærming til logistisk regresjon, er parameterne vi estimerer oddsforhold.

Et alternativ til logistisk regresjon er å bruke en loggkoblingsregresjonsmodell, noe som resulterer i (log) parametere for risikoforhold. Dessverre har disse historisk sett hatt numeriske problemer når de prøver å tilpasse dem til data (se her for en artikkel om dette).Imidlertid er det også et mer grunnleggende problem med loggkoblingsregresjon, ved at loggkoblingen betyr at visse kombinasjoner av kovariate verdier kan føre til tilpassede sannsynligheter utenfor (0,1) -området.

Case control studies

I casestyringsstudier velges enkeltpersoner inn i studien med en sannsynlighet som avhenger av om de opplevde hendelsen av interesse eller ikke. De er spesielt nyttige for å studere sykdommer som sjelden forekommer. En case control studie kan (forsøke) å registrere alle de som opplever hendelsen av interesse i en gitt tidsperiode, sammen med en rekke «kontroller», dvs. personer som ikke opplevde hendelsen av interesse. I en casekontrollstudie er andelen tilfeller under etterforskerens kontroll, og spesielt er andelen i studien ikke representativ for forekomsten i målpopulasjonen. Som en konsekvens kan man ikke estimere risiko eller risikoforhold fra sakskontroll. studier, i hvert fall ikke uten ekstern tilleggsinformasjon. Det viser seg imidlertid at oddsforholdet fremdeles kan estimeres gyldig med en saksstyringsdesign på grunn av en viss symmetriegenskap som oddsforholdet har.

Sjelden utfall

Når interessehendelsen er sjelden (dvs. at sannsynligheten for at den oppstår er lav), er oddsene og risikoforholdene numerisk ganske like. I situasjoner med sjeldne utfall kan et oddsforhold tolkes som om det var et risikoforhold, siden de vil være numerisk like. Men når resultatet ikke er sjeldent, kan de to tiltakene være vesentlig forskjellige (se for eksempel her).

Leave a Reply

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *