Kertoimet ja kertoimet ovat tärkeä mittari mielenkiintoisen tapahtuman absoluuttiselle / suhteelliselle mahdollisuudelle, mutta niiden tulkinta on joskus vähän hankala hallita. Tässä lyhyessä kirjoituksessa ”kuvaan näitä käsitteitä (toivottavasti) selkeällä tavalla.
Todennäköisyydestä kertoimeen
Lähtökohtana on käyttää todennäköisyyttä ilmaisemaan mahdollisuus, että mielenkiintoinen tapahtuma tapahtuu. Joten todennäköisyys 0,1 tai 10% tarkoittaa, että tapahtumalla on 1: 10 mahdollisuus. Tavallinen tapa ajatella todennäköisyyttä on, että jos voimme toistaa tarkasteltavan kokeen tai prosessin suuren määrän kertoja kokeiden, joissa tapahtuma tapahtuu, tulisi olla lähellä todennäköisyyttä (esim. 0,1).
Murto-osuudet ja uhkapelit
Erityisesti uhkapelimaailmassa, kertoimet ilmaistaan joskus murtoina henkisten laskelmien helpottamiseksi. Esimerkiksi kertoimet 9: 1 vastaan, sanottu ”yhdeksältä yhdelle vastaan” ja kirjoitettu 9/1: llä tai 9: 1, tarkoittaa kiinnostavaa tapahtumaa. esiintyy kerran joka 9. kerta, kun tapahtumaa ei tapahdu. Toisin sanoen 10 kertaa / toistona, odotamme kiinnostavan tapahtuman tapahtuvan kerran ja t hän ei tule tapahtumaan muilla 9 kertaa. Kerrointen käyttäminen todennäköisyyksien ilmaisemiseen on hyödyllistä uhkapeliympäristössä, koska sen avulla voidaan helposti laskea voiton määrä – kertoimella 9/1 voitat 9 vedolla 1 (olettaen, että panoksesi on hyvä!).
Kerroinsuhteet
Tilastomaailmassa kertoimien suhdelukuja käytetään usein ilmaisemaan tapahtuman suhteellinen mahdollisuus kahdessa eri olosuhteessa. Esimerkiksi kliinisen tutkimuksen yhteydessä, jossa verrataan olemassa olevaa hoitoa uuteen hoitoon, voimme verrata huonon lopputuloksen todennäköisyyttä, jos potilas ottaa uuden hoidon huonoon lopputulokseen, jos potilas ottaa lääkkeen. olemassa oleva hoito.
Oletetaan, että huonon lopputuloksen todennäköisyys on 0,2, jos potilas ottaa olemassa olevan hoidon, mutta että se pienenee 0,1: een, jos hän ottaa uuden hoidon. Todennäköisyys huonoon lopputulokseen nykyisellä hoidolla on 0,2 / 0,8 = 0,25, kun taas uuden hoidon kerroin on 0,1 / 0,9 = 0,111 (toistuva). Kerroin suhde, joka vertaa uutta hoitoa vanhaan hoitoon, on yksinkertaisesti vastaava kertoimien suhde: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (toistuva). Tämä tarkoittaa sitä, että huonon lopputuloksen todennäköisyys, jos potilas ottaa uuden hoidon, on 0,444 kuin huonon lopputuloksen kerroin, jos hän käyttää olemassa olevaa hoitoa. Huonon lopputuloksen todennäköisyydet (ja siten myös todennäköisyys) vähenevät ottamalla uusi hoito. Voimme myös ilmaista vähennyksen sanomalla, että kertoimet pienenevät noin 56%, koska kertoimet pienenevät kertoimella 0,444.
Miksi kertoimet eivätkä riski / todennäköisyyssuhteet?
Ihmiset usein (mielestäni aivan ymmärrettävästi) löytävät kertoimia ja siten myös kerroinsuhteita, joita on vaikea intuitiivisesti tulkita. Vaihtoehto on laskea riski- tai todennäköisyyssuhteet. Kliinisessä tutkimuksessa riskin (lukutodennäköisyyden) suhde on yksinkertaisesti uuden hoidon huonon lopputuloksen todennäköisyyden suhde nykyisen hoidon todennäköisyyteen, ts. 0,1 / 0,2 = 0,5. Tämä tarkoittaa, että uuden hoidon huonojen lopputulosten riski on puolet nykyisen hoidon mukaisesta tai vaihtoehtoisesti riski pienenee puoleen. Riskisuhde on intuitiivisesti paljon helpompi ymmärtää. Joten miksi käytämme kertoimia ja kerroinsuhteita tilastoissa?
Logistinen regressio
Haluamme usein tehdä enemmän kuin vain verrata kahta ryhmää todennäköisyyden / riskin / kertoimien suhteen tulokset. Erityisesti olemme kiinnostuneita soveltamaan tilastollisia malleja, jotka kuvaavat kuinka kiinnostavan tapahtuman mahdollisuus riippuu useista kovariaateista tai ennustajista. Tällaiset mallit voidaan asentaa yleistettyyn lineaariseen malliperheeseen. Suosituin malli on logistinen regressio, joka käyttää logit-linkkitoimintoa. Tämä linkkitoiminnon valinta tarkoittaa, että sovitetut malliparametrit ovat log-kerroinsuhteita, jotka ohjelmistossa yleensä eksponentoidaan ja raportoidaan kerroinsuhteina. Logit-linkkitoimintoa käytetään, koska binaarisen lopputuloksen saamiseksi se on ns. Kanoninen linkkitoiminto, joka tarkemmin käsittelemättä tarkoittaa, että sillä on tiettyjä suotuisia ominaisuuksia. Jos siis käytämme malleja binäärituloksiin, jos käytämme logistisen regressioon oletuslähestymistapaa, arvioimamme parametrit ovat kerroinsuhteita.
Vaihtoehto logistiselle regressiolle on käyttää lokilinkin regressiomallia, joka johtaa (log) riskisuhteen parametrit. Valitettavasti nämä ovat historiallisesti kärsineet numeerisista ongelmista yrittäessään sovittaa ne tietoihin (katso tästä tästä artikkeli).Lokilinkin regressiossa on kuitenkin myös perustavanlaatuisempi ongelma, sillä lokilinkki tarkoittaa, että tietyt kovariaattiarvojen yhdistelmät voivat johtaa sovitettuihin todennäköisyyksiin alueen (0,1) ulkopuolella.
Tapausohjaustutkimukset
Tapaustarkastustutkimuksissa yksilöt valitaan tutkimukseen todennäköisyydellä, joka riippuu siitä, kokivatko he kiinnostavan tapahtuman vai eivät. Ne ovat erityisen hyödyllisiä harvinaisten sairauksien tutkimiseen. Tapaustarkastustutkimus voi (yrittää) rekisteröidä kaikki ne, jotka kokevat kiinnostavan tapahtuman tiettynä ajanjaksona, sekä joukko ”kontrolleja”, ts. Henkilöt, jotka eivät kokeneet kiinnostavaa tapahtumaa. Tapauskontrollitutkimuksessa tapausten osuus on tutkijan valvonnassa, ja etenkään tutkimuksen osuus ei edusta kohdepopulaation ilmaantuvuutta. Tämän seurauksena tapausvalvonnasta ei voida arvioida riskiä tai riskisuhteita tutkimukset, ainakaan ilman ulkoista lisätietoa. On kuitenkin käynyt ilmi, että kertoimien suhde voidaan silti pätevästi arvioida tapausohjaussuunnittelulla, johtuen tietystä symmetriaominaisuudesta, jolla on kerroinsuhde. tulokset
Kun kiinnostava tapahtuma on harvinainen (ts. todennäköisyys sen esiintymiselle on pieni), kertoimet ja riskisuhteet ovat numeerisesti melko samanlaiset. se oli riskisuhde, koska ne ovat numeerisesti samanlaisia. Jos tulos ei ole harvinainen, nämä kaksi mittaria voivat kuitenkin olla huomattavasti erilaisia (katso esimerkiksi täällä).