Az esélyek és az esélyhányadok fontos mérőszámai az érdekes esemény abszolút / relatív esélyének, de értelmezésük néha kissé trükkös elsajátítani. Ebben a rövid bejegyzésben ezeket a fogalmakat (remélhetőleg) világos módon ismertetem.
A valószínűségtől az esélyekig
Kiindulópontunk az, hogy a valószínűség használatával kifejezzük annak esélyét, hogy érdekes esemény következik be. Tehát a 0,1 vagy 10% -os valószínűség azt jelenti, hogy az esemény bekövetkeztének 1: 10 esélye van. A valószínűségről általában az a gondolkodásmód, hogy ha megismételhetnénk a vizsgált kísérletet vagy folyamatot sokszor az esemény bekövetkezésének azon részeinek, amelyeknél az esemény bekövetkezik, közel kell lennie a valószínűséghez (pl. 0,1).
Részleges esélyek és szerencsejáték
Különösen a szerencsejáték világában, az esélyeket néha töredékként fejezik ki, a mentális számítások megkönnyítése érdekében. Például a 9: 1-es odds esély, amelyet “kilenc az egy ellen” -nek mondanak, és amelyet 9/1 vagy 9: 1-nek írnak, azt jelenti, hogy az érdekes esemény 9 alkalommal egyszer fordul elő, hogy az esemény nem következik be. Ez 10-szeres / ismétlődésként számítunk arra, hogy az érdekes esemény egyszer megtörténik, és az esemény nem fordul elő a másik 9 alkalommal. Az esélyek felhasználása a valószínűségek kifejezésére hasznos egy szerencsejáték-környezetben, mert ez lehetővé teszi az ember számára, hogy kiszámolja, mennyit nyerne – 9/1-es szorzóval 9-et fog nyerni 1-es tét esetén (feltéve, hogy a tétele jó lesz!).
Nyereményszorzók
A statisztikákban az esélyek arányát gyakran használják arra, hogy kifejezzék egy esemény két különböző körülmények között történő relatív esélyét. Például egy meglévő kezelést és egy új kezelést összehasonlító klinikai vizsgálat keretében összehasonlíthatjuk a rossz kimenetel valószínűségét, ha a páciens az új kezelést a rossz kimenetel valószínűségével veszi át, ha a beteg meglévő kezelés.
Tegyük fel, hogy a rossz kimenetel valószínűsége 0,2, ha a beteg megkezdi a meglévő kezelést, de ez 0,1-re csökken, ha új kezelést alkalmaz. A rossz kimenetel esélye a meglévő kezelésre 0,2 / 0,8 = 0,25, míg az új kezelésre 0,1 / 0,9 = 0,111 (visszatérő). Az új kezelés és a régi kezelés összehasonlító esélyhányados tehát egyszerűen az esélyek megfelelő aránya: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (visszatérő). Ez azt jelenti, hogy a rossz kimenetel esélye, ha a beteg új kezelést alkalmaz, 0,444, mint a rossz kimenetel esélye, ha a meglévő kezelést alkalmazza. A rossz kimenetel esélye (és ennélfogva) csökken az új kezelés alkalmazásával. A csökkentést úgy is kifejezhetnénk, hogy az esélyek körülbelül 56% -kal csökkennek, mivel az esélyek 0,444-es tényezővel csökkennek.
Miért az esélyek aránya, és nem a kockázat / valószínűség aránya?
Az emberek gyakran (azt hiszem, érthetően) nehezen értelmezhetők az esélyek, következésképpen az esélyek aránya is. Alternatív megoldás a kockázati vagy valószínűségi arány kiszámítása. A klinikai vizsgálati példában a kockázati (leolvasási valószínűség) arány egyszerűen az új kezelés alatti rossz kimenetel valószínűségének és a meglévő kezelés szerinti valószínűségnek az aránya, vagyis 0,1 / 0,2 = 0,5. Ez azt jelenti, hogy a rossz kimenetel kockázata az új kezelés fele, mint a jelenlegi kezelés, vagy a kockázat felére csökken. Intuitív módon a kockázati arány sokkal könnyebben érthető. Miért használjuk tehát az esélyeket és az odds arányokat a statisztikákban?
Logisztikai regresszió
Gyakran többet akarunk tenni, mint hogy két csoportot hasonlítsunk össze egy esély valószínűségével / kockázatával / esélyeivel kapcsolatban eredmény. Konkrétan arra vagyunk kíváncsiak, hogy olyan statisztikai modelleket illesszünk be, amelyek leírják, hogyan függ az érdekes esemény bekövetkezésének esélye számos kovariátustól vagy prediktortól. Ilyen modellek illeszthetők az általánosított lineáris modellcsaládba. A legnépszerűbb modell a logisztikai regresszió, amely a logit link függvényt használja. Ez a kapcsolati funkció választása azt jelenti, hogy az illesztett modellparaméterek a log log odds arányok, amelyek a szoftverekben általában hatványozottak és odds arányokként vannak jelentve. A logit link függvény azért használatos, mert a bináris eredmény elérése érdekében ez az úgynevezett kanonikus link függvény, amely további részletek nélkül azt jelenti, hogy bizonyos kedvező tulajdonságokkal rendelkezik. Következésképpen a bináris kimenetek modelljeinek illesztésekor, ha a logisztikai regresszió alapértelmezett megközelítését alkalmazzuk, az általunk becsült paraméterek szorzókarányok.
A logisztikai regresszió alternatívája a log link regressziós modell használata, amelynek eredményeként (log) kockázati arány paraméterek. Sajnos történelmileg ezek számszerű problémáktól szenvedtek, amikor megpróbálták őket az adatokhoz illeszteni (erről itt olvashat egy cikket).Van azonban egy alapvető probléma a log link regresszióval is, mivel a log link azt jelenti, hogy a kovariált értékek bizonyos kombinációi a (0,1) tartományon kívül eső valószínűségekhez vezethetnek.
Esettanulmány-tanulmányok
Esettanulmány-vizsgálatok során az egyéneket olyan valószínűséggel választják ki a vizsgálatba, amely attól függ, hogy átélték-e az érdekes eseményt vagy sem. Különösen hasznosak a ritkán előforduló betegségek tanulmányozásában. Esettanulmány-tanulmányba be lehet (megkísérelni) beírni mindazokat, akik egy adott időszakban átélik az érdeklődésre számot tartó eseményt, valamint számos “kontrollt”, vagyis olyan személyt, aki nem élte meg az érdekes eseményt. Esettanulmány-tanulmányban az esetek aránya a vizsgáló ellenőrzése alatt áll, és különösen a vizsgálatban szereplő arány nem reprezentatív a célpopulációban előforduló incidenciával szemben. Ennek eredményeként nem lehet megbecsülni az esetkontrollból származó kockázatot vagy kockázat-arányt tanulmányok, legalábbis nem külső kiegészítő információk nélkül. Kiderült azonban, hogy az esélyek aránya mégis érvényesen megbecsülhető egy esetszabályozási tervvel, az esélyek bizonyos szimmetriatulajdonságának köszönhetően.
Ritka kimenetel
Ha az érdekes esemény ritka (vagyis annak valószínűsége alacsony), az esélyek és a kockázati arányok számszerűen meglehetősen hasonlóak. Így ritka kimenetelű helyzetekben az esélyhányados úgy értelmezhető, mintha kockázati arány volt, mivel számszerűen hasonlóak lesznek. Ha azonban az eredmény nem ritka, akkor a két mérték lényegesen különbözhet (lásd például itt).