Bruk og tolkning av kvasi-eksperimentelle studier ved smittsomme sykdommer

Sammendrag

Quasi-eksperimentelle studiedesigner, noen ganger kalt ikke-randomiserte, pre-post-intervensjon studiedesigner , er allestedsnærværende i litteraturen om smittsomme sykdommer, spesielt innen intervensjoner som tar sikte på å redusere spredningen av antibiotikaresistente bakterier. Lite er skrevet om fordelene og begrensningene ved den kvasi-eksperimentelle tilnærmingen. Denne artikkelen skisserer et hierarki av kvasi-eksperimentell studiedesign som gjelder for smittsomme sykdomsstudier, og som, hvis det brukes, kan føre til sunnere forskning og mer overbevisende årsakssammenheng mellom smittsomme sykdomsintervensjoner og utfall.

I studien av smittsomme sykdommer og spesielt i studien av infeksjonskontroll og antibiotikaresistens, brukes ofte den kvasi-eksperimentelle studiedesignen, noen ganger kalt design før intervensjonen, for å evaluere fordelene med spesifikke inngrep. Vi gjennomgikk studier publisert i to tidsskrifter (Clinical Infectious Diseases and Infection Control and Hospital Epidemiology) i løpet av en 1,5-års periode fra 1. januar 2002 til 1. juni 2003 og fant 36 kvasi-eksperimentelle studier.

Quasi-eksperimentell studier omfatter et bredt spekter av ikke-randomiserte intervensjonsstudier. Disse designene brukes ofte når det ikke er logistisk eller ikke etisk å gjennomføre en randomisert, kontrollert studie – «gullstandarden» for årsaksforskningsdesign. Eksempler på kvasi-eksperimentelle studier følger. For eksempel hvis et sykehus innfører bruk av et alkoholbasert hånddesinfeksjonsmiddel, vil sykehuset kanskje studere effekten av denne intervensjonen på utfallet av anskaffelse av antibiotikaresistente bakterier, på grunnlag av overvåkingskultur. Intervensjonen er implementert, anskaffelsesgraden måles før intervensjonen og etter intervensjonen, og resultatene blir analysert. Som et annet eksempel, hvis et sykehus har en økende frekvens av ventilatorassosiert lungebetennelse (VAP), kan sykehuspersonalet utforme en pedagogisk intervensjon med sikte på å redusere frekvensen av VAP og sammenligne priser før og etter intervensjonen. Et tredje eksempel vil være en studie av effekten av et antimikrobielt forvaltnings- / utdanningsprogram på preintervensjon og postintervju. entions antibiotikaforskrivningspraksis.

Ettersom kapasiteten til å samle rutinemessige kliniske data har økt, har bruken av kvasi-eksperimentelle studiedesigner i studien av smittsomme sykdommer og i andre medisinske fagområder også blitt økt. Imidlertid er det lite skrevet om disse studiedesignene i medisinsk litteratur eller i tradisjonelle epidemiologiske lærebøker. I motsetning til dette er samfunnsvitenskapelig litteratur fylt med eksempler på måter å implementere og forbedre kvasi-eksperimentelle studier på.

I denne artikkelen tar vi sikte på å gjennomgå de forskjellige kvasi-eksperimentelle studiedesignene og hierarkiet til disse designene. med hensyn til deres evne til å etablere årsakssammenhenger mellom en intervensjon og et utfall. Eksemplet på en alkoholbasert hånddesinfeksjonsmiddelintervensjon som tar sikte på å redusere antibiotikaresistente oppkjøpshastigheter for bakterier, vil bli brukt gjennom hele artikkelen for å illustrere de forskjellige kvasi-eksperimentelle studiedesignene. Vi diskuterer problemer som oppstår i kvasi-eksperimentelle studiedesigner og tilbyr metoder for å forbedre dem.

Metoder

Vi gjennomgikk artikler og bokkapitler som diskuterer utformingen av kvasi-eksperimentelle studier. De fleste av artiklene refererte til to lærebøker, som deretter ble gjennomgått i dybden.

Viktige fordeler og ulemper ved kvasi-eksperimentelle studier, da de vedrører studiet av smittsomme sykdommer, ble identifisert. Potensielle metodiske feil ved kvasieksperimenter i studien av smittsomme sykdommer ble identifisert. I tillegg gis en oppsummerende figur som skisserer et hierarki av kvasi-eksperimentelle studiedesigner (figur 1): design med høyere tall har mer intern validitet overfor potensiell årsakssammenheng mellom intervensjonen og utfallet.

Figur 1

Hierarki for de 8 kvasi-eksperimentelle studiedesignene som er mest relevante for forskning på smittsomme sykdommer. Design med høyere tall har mer intern validitet overfor potensiell årsakssammenheng mellom intervensjonen og utfallet.

Figur 1

Hierarki av de 8 kvasi-eksperimentelle studiedesignene som er mest relevante for forskning på smittsomme sykdommer. Design med høyere tall har mer intern validitet overfor potensiell årsakssammenheng mellom intervensjonen og utfallet.

Resultater og diskusjon

Hva er en kvasieksperiment?

Kvasieksperimenter er studier som tar sikte på å evaluere inngrep, men som ikke bruker randomisering.I likhet med randomiserte studier har kvasi-eksperimenter som mål å demonstrere kausalitet mellom en intervensjon og et utfall.

På bakgrunn av denne definisjonen er det tydelig at mange publiserte studier i litteraturen om smittsomme sykdommer og spesielt i studie av antibiotikaresistens, bruk den kvasi-eksperimentelle studiedesignen. Den randomiserte, kontrollerte studien anses generelt å ha det høyeste nivået av troverdighet med hensyn til å vurdere årsakssammenheng; imidlertid på sykehus eller folkehelse kan intervensjonen ofte ikke randomiseres, av en eller flere grunner: (1) etiske hensyn, (2) manglende evne til å randomisere pasienter, (3) manglende evne til å randomisere lokasjoner, og (4) ) et behov for å gripe inn raskt. Hver av disse årsakene blir diskutert nedenfor.

Etiske betraktninger tillater vanligvis ikke tilbakeholdelse av en intervensjon som har kjent effekt. Hvis effekten av en intervensjon ikke er fastslått, så er en randomisert, kontrollert studie den valgte designen for å bestemme effekten. Men hvis intervensjonen som er studert inkluderer en akseptert, veletablert terapeutisk intervensjon, eller hvis intervensjonen har tvilsom effekt på grunnlag av tidligere utførte kvasi-eksperimentelle eller observasjonsstudier, blir etiske spørsmål angående randomisering av pasienter reist.

Intervensjoner kan ofte ikke randomiseres til individuelle pasienter. For eksempel er det vanskelig å randomisere bruken av desinfeksjonsmiddel til individuelle rom eller individuelle pasienter ved å studere effekten av bruk av et alkoholbasert hånddesinfeksjonsmiddel på vancomycinresistent enterokokker (VRE), bestemt av overvåkingskultur. , når en gang det er desinfisert, er det lite sannsynlig at en medarbeider godtar å bli forurenset før han eller hun ser neste pasient – og det er heller ikke sannsynlig at en IRB vil godta dette. Tilsvarende kan en utdanningsbasert intervensjon for å redusere VAP ikke randomiseres til individuelle pasienter.

Intervensjoner kan ofte ikke randomiseres til individuelle steder. For eksempel er det vanskelig å randomisere bruken av det alkoholbaserte hånddesinfeksjonsmiddelet til bare noen helsepersonell. Når denne utformingen av randomiserte steder er vellykket, er stedene vanligvis geografisk skilt; dette innebærer flere spørsmål om andre faktorer rundt miljøet er forskjellige, noe som ytterligere kompliserer utformingen og analysen. Et kompromiss som er benyttet er å randomisere forskjellige enheter på samme sykehus. Det er imidlertid vanskelig politisk å implementere bruk av et alkoholbasert desinfeksjonsmiddel bare i visse deler av et sykehus eller bare på visse sider av en avdeling. Et annet underutnyttet alternativ er randomiseringsprøven med klynger, der intakte grupper eller «klynger», i stedet for enkeltpersoner, randomiseres.

Det er ofte et behov for å gripe inn raskt når vi søker å kontrollere en smittsom sykdom. som gjør det vanskelig å gjennomføre en randomisert prøve på riktig måte. Ved infeksjonsutbrudd forårsaket av for eksempel antibiotikaresistente bakterier, er det ofte press på å avslutte utbruddet ved å gripe inn i alle mulige områder, og dermed er det ikke mulig å holde tilbake pleie, som ville forekomme i en randomisert kontrollert studie der en av gruppene ikke fikk behandling. Den kliniske og etiske nødvendigheten av å gripe inn gjør det raskt eller umulig å gjennomføre den langvarige prosessen med å implementere en randomisert studie. I tillegg er det betydelig debatt i litteraturen om avtalen mellom randomiserte studier og observasjonsstudier. Derfor blir mange studier utført med tilbakevirkende kraft, etter et inngrep ble implementert for å avslutte et slikt utbrudd.

Hva er truslene mot å etablere kausalitet når kvasi-eksperimentelle design brukes i studien av smittsomme sykdommer?

Mangelen på tilfeldig tildeling er den største svakheten ved den kvasi-eksperimentelle studiedesignen. Assosiasjoner identifisert i kvasi-eksperimenter oppfyller noen krav til kausalitet, fordi intervensjonen går foran måling av utfallet. Resultatet kan også demonstreres å variere statistisk med intervensjonen. Dessverre innebærer ikke statistisk tilknytning årsakssammenheng, spesielt hvis studien er dårlig utformet. I mange kvasieksperimenter sitter man altså ofte med spørsmålet: Finnes det alternative forklaringer på den tilsynelatende årsakssammenhengen? Hvis disse alternative forklaringene er troverdige, er bevisene mindre enn overbevisende. Disse rivaliserende hypotesene eller alternative forklaringer kommer fra prinsippene for epidemiologisk studiedesign.

De metodologiske prinsippene som oftest resulterer i alternative forklaringer i kvasi-eksperimentelle studier av smittsomme sykdommer inkluderer følgende: (1) vanskeligheter med å kontrollere for viktige forvirrende variabler, (2) resultater som forklares med det statistiske prinsippet om regresjon til gjennomsnittet, og (3) modningseffekter.

Vanskeligheten med å kontrollere viktige forvirrende variabler oppstår fra mangel på randomisering. For eksempel, i en studie som tar sikte på å demonstrere at innføringen av et alkoholbasert hånddesinfeksjonsmiddel førte til lavere anskaffelsesrater for antibiotikaresistente bakterier, er det en rekke viktige potensielle forvirrende variabler som kan ha vært forskjellige mellom de to periodene (dvs. , preintervensjonen og postintervensjonsperioden); variablene inkluderer alvorlighetsgraden av sykdommen, kvaliteten på medisinsk pleie og pleiebehandling, og foreskrivelse av antibiotika. I en multivariabel regresjon kunne den første variabelen adresseres gjennom sykdomsmål, men den andre og tredje forvirrende variabelen ville være vanskelig, om ikke nesten umulig, å måle og kontrollere.

Regresjon til middel er et utbredt statistisk fenomen. Det kan føre til at man feilaktig konkluderer med at en effekt skyldes behandling når den faktisk skyldes tilfeldigheter. Fenomenet ble først beskrevet i 1886 av Francis Galton. Han målte voksenhøyden til barn og deres foreldre, og bemerket at når gjennomsnittshøyden til foreldrene var større enn gjennomsnittshøyden i befolkningen, hadde barna en tendens til å være kortere enn foreldrene. Når foreldrenes gjennomsnittshøyde var kortere enn gjennomsnittshøyden i befolkningen, pleide barna å være høyere enn foreldrene.

Hva utløser implementeringen av en smittsom sykdom ved behandling av mange smittsomme sykdommer? intervensjon er en økning i frekvensen over gjennomsnittet eller normen. For eksempel brukes statistiske kontrolldiagrammer ofte i infeksjonskontroll for å varsle infeksjonskontrollpersonell om at frekvensen av VAP eller anskaffelse av antibiotikaresistente bakterier er høyere enn vanlig. Det statistiske prinsippet om regresjon til gjennomsnittet forutsier at disse forhøyede frekvensene vil ha en tendens til å synke, selv uten inngrep. Sykehuspersonell kan imidlertid ikke vente passivt på at denne tilbakegangen skal skje. Derfor implementerer sykehuspersonell ofte en eller flere inngrep, og hvis en nedgang i frekvensen oppstår, kan de feilaktig konkludere med at tilbakegangen er årsakssammenheng med intervensjonen. Faktisk kan en alternativ forklaring være regresjon til gjennomsnittet.

Modningseffekter er en trussel mot gyldigheten av å konkludere med at en intervensjon forårsaket et utfall. Disse effektene er relatert til naturlige endringer som pasienter opplever med tiden. Disse modningsendringene kan true studiens interne gyldighet. I tillegg er det sykliske sesongmessige trender som kan være en trussel mot gyldigheten av å tilskrive et observert resultat til en intervensjon. For eksempel har virusinfeksjoner sesongmessige mønstre som fører til høyere VAP-priser om vinteren. I vår eksempelstudie, hvis den preintervensjonelle VAP-hastigheten måles om vinteren, og intervensjonen skjer om våren, kan fallet i VAP-hastigheten skyldes sesongmessig trend og ikke intervensjonen.

Hva er de forskjellige kvasi-eksperimentelle studiedesignene?

I samfunnsvitenskapelig litteratur er kvasi-eksperimentelle studier delt inn i 3 studiedesignkategorier:

1. Kva-eksperimentelle studiedesigner som ikke bruker kontrollgrupper

2. Kva-eksperimentelle studiedesigner som bruker kontrollgrupper, men ingen forprøve

3. Kva-eksperimentelle studiedesigner som bruker kontrollgrupper og pretester

Det er et hierarki innenfor disse kategoriene av studiedesigner, med kategori 3-studier som er sunnere enn de i kategori 2 eller 1, når det gjelder å etablere kausalitet. Derfor, hvis mulig, bør etterforskerne sikte på å designe studier som faller inn i kategori 3.

Shadish et al. diskutere 7 design i kategori 1; 3 design i kategori 2; og 6 design i kategori 3. Vi bestemte oss for at kategori 2-studier sjelden er anvendbare i forskning på smittsomme sykdommer, fordi forhåndstestmålinger nesten alltid er tilgjengelige. Videre bestemte vi oss for at de fleste kvasi-eksperimenter i studien av smittsomme sykdommer kunne karakteriseres av 5 studiedesign i kategori 1 og av 3 design i kategori 3, fordi de andre studiedesignene ikke ble brukt i studien av smittsomme sykdommer, ifølge litteratur. For enkelhets skyld har vi derfor oppsummert de åtte studiedesignene som er mest relevante for forskning på smittsomme sykdommer i de følgende avsnittene og i figur 1. I hver symbolsk notasjon beveger tiden seg fra venstre til høyre.

Kategori 1: Kvasi -eksperimentelle studiedesigner som ikke bruker kontrollgrupper.

1. 1-gruppe for-test-posttest-design.

Dette er et ofte brukt studiedesign. En enkelt forhåndstest observasjonsmåling (O1) utføres, en intervensjon (X) implementeres, og en posttestmåling (O2) utføres.For eksempel kan O1 være anskaffelsesfrekvensen av VRE som bestemt av resultatene av perirekte overvåkingskulturer, X kan være innføringen av bruk av et alkoholbasert hånddesinfeksjonsmiddel, og O2 kan være anskaffelsesgraden for anskaffelse av VRE etter intervensjonen . Inkluderingen av en forprøve gir litt informasjon om hva anskaffelseshastighetene kan ha vært dersom inngrepet ikke skjedde.

2. 1-gruppe for-test-posttest-design som bruker en dobbel pretest.

Fordelen med denne studiedesignet fremfor design 1 er at tillegget til en andre pretest-måling før intervensjonen reduserer sannsynligheten for at regresjon til gjennomsnitt, modning og / eller sesongmessighet kan forklare den observerte sammenhengen mellom intervensjonen og utfallet etter test. For eksempel, i en studie der bruk av et alkoholbasert hånddesinfeksjonsmiddel førte til lavere VRE-anskaffelseshastigheter (O3 < O2 og O1), hvis 1 studie hadde to preintervensjonsmålinger av VRE anskaffelseshastigheter (O1 og O2), og de var begge forhøyede, ville dette antyde at det var en redusert sannsynlighet for at O3 var lavere på grunn av forvirrende variabler, modningseffekter, sesongeffekter eller regresjon til gjennomsnittet.

3. 1-gruppe før-test-posttest-design som bruker en ikke-ekvivalent avhengig variabel.

Denne designen inkluderer inkludering av en ikke-ekvivalent avhengig variabel (b), i tillegg til den primære avhengige variabelen (a). Variabler a og b skal vurdere lignende konstruksjoner; det vil si at de to målingene skal ha lignende potensielle årsaksvariabler og forvirrende variabler, bortsett fra effekten av intervensjonen. Variabel a forventes å endre seg på grunn av intervensjonen X, mens variabel b ikke er det. Tar vi vårt VAP-eksempel, kan variabel a være forekomsten av VAP, og variabel b kan være forekomsten av kateterassosiert urinveisinfeksjon (UTI). Hvis en pedagogisk intervensjon er rettet mot å oppmuntre sykehuspersonalet til å heve hodene på pasientens senger og følge en avvenningsprotokoll for mekanisk ventilasjon, ville man forvente å observere en reduksjon i forekomsten av VAP, men ikke i forekomsten av UTI. Imidlertid en rekke viktige forvirrende variabler, som alvorlighetsgraden av sykdommen og antibiotikaforskrivningspraksisen, kan påvirke begge utfallsmålingene. Hvis VAP- og UTI-frekvensen begge ble målt, og hvis VAP-frekvensen redusert etter intervensjonen, men UTI-frekvensen gjorde ikke, da ville dataene være mer overbevisende enn om bare VAP-hastigheter ble målt.

Denne designen legger til en tredje måling etter test (03) til 1-gruppe før-test-design og fjerner deretter intervensjonen før en endelig tiltak (O4) er laget. Fordelen med denne designen er at den lar en teste hypoteser om utfallet både i nærvær og i fravær av intervensjonen. Hvis man så forutsier en reduksjon i mellom O1 og O2 (dvs. etter implementering av intervensjonen), ville man forutsi en økning i utfallet mellom O3 og O4 (dvs. etter fjerning av intervensjonen). En advarsel er at hvis intervensjonen antas å ha vedvarende effekter, må O4 måles etter at disse effektene sannsynligvis vil ha forsvunnet. For eksempel ville en studie være mer overbevisende hvis den viste at frekvensen av oppkjøpet av VRE redusert etter en intervensjon med alkoholbasert hånddesinfeksjonsmiddel (O2 og O3 mindre enn O1), og at når bruken av desinfeksjonsmiddelet ble avbrutt, økte hastighetene (O4 større enn O2 og O3 og nærmere 01).

Fordelen med denne designen er at den viser reproduserbarhet av sammenhengen mellom intervensjonen og utfallet. For eksempel er det mer sannsynlig at foreningen er årsakssammenheng hvis man demonstrerer at bruk av et alkoholbasert hånddesinfeksjonsmiddel resulterer i reduserte antibiotikaresistenshastigheter både når den først introduseres og igjen når den gjeninnføres etter et avbrudd i intervensjonen. Som i studiedesign 3, må antas at effekten av intervensjonen er forbigående. Denne designen brukes ikke ofte i studien av smittsomme sykdommer på grunn av de etiske problemene som er involvert i å fjerne en behandling som ser ut til å være effektiv. Imidlertid er det epidemiologisk en bedre design enn de som tidligere er skissert.

Kategori 3: Kvasi-eksperimentelle design som bruker kontrollgrupper og forprøver. Leseren bør merke seg at intervensjonen ikke er randomisert i alle disse studiedesignene. Kontrollgruppene som er valgt er sammenligningsgrupper. Å få forhåndstestmålinger for både intervensjons- og kontrollgruppene gjør at man kan vurdere gruppens innledende sammenlignbarhet. Antagelsen er at jo mindre forskjellen er mellom målinger før test, desto mindre sannsynlighet er det for at det er viktige forvirrende variabler mellom de to gruppene.

Mont Blanc