En falsk korrelasjon oppstår når to variabler er statistisk relaterte, men ikke direkte kausalt relaterte. Disse to variablene ser feilaktig ut til å være relatert til hverandre, normalt på grunn av en usett, tredje faktor.
For eksempel har prisen på kinobilletter de siste 30 årene økt og antallet av folk som går på kino har også steget. Det vil imidlertid være en feil å konkludere med at hvis kinoer øker prisene, vil oppmøtet også øke. Likeledes ville det være galt å anta at prisveksten var direkte forårsaket av økningen i fremmøte.
Eksempel på falsk korrelasjon
Hver prikk i diagrammet nedenfor viser tallet av sjåførdødsfall i jernbanekollisjoner etter år (horisontal posisjon), og USAs årlige import av norsk råolje. Det er en sterk sammenheng tydelig i dataene med en korrelasjonsstatistikk på 0,95. Likevel er dette en falsk korrelasjon fordi det ikke er noen grunn til å tro at jernbanedødsfall forårsaker oljeimport, eller omvendt.
Årsaker til falsk korrelasjon
Én årsak til falske sammenhenger er tilfeldigheter. Hvis du ser hardt nok, mangler det ikke tilfeldigheter i naturen. Det spesifikke eksemplet som er vist ovenfor er fra et nettsted dedikert til å finne og dele humoristiske falske korrelasjoner.
En mer problematisk type falsk korrelasjon er en der det er en årsakssammenheng, men ikke direkte sammenheng mellom de to variablene. I det tidligere eksemplet på kinooppmøte og priser går prisene opp på grunn av inflasjon mens oppmøte øker på grunn av befolkningsvekst og høyere nivåer av disponibel inntekt – begge skjer over tid. Dermed «får» en tredje variabel, tid, korrelasjonen til å vises.
Diagnostisering av falsk korrelasjon
Det er vanligvis vanskelig å diagnostisere falsk korrelasjon, siden en persons teori er ano personens konspirasjonsteori eller tilfeldighet. Det mest kjente eksemplet på dette var debatten om global oppvarming er en konsekvens av menneskelige handlinger eller ikke. I det 20. århundre oppstod en lignende debatt om tobakkbruk forårsaket lungekreft.
Hovedverktøyet for å diagnostisere om en sammenheng er falsk eller ikke, er å undersøke kvaliteten på teorien bak den. Når det gjelder tobakk og lungekreft, var det bare en klar forklaring på den biologiske mekanismen som førte til at røyking førte til lungekreft, avgjort debatten.
En mer datadrevet tilnærming til diagnostisering av falsk korrelasjon er å bruke statistisk teknikker for å undersøke restene. Hvis restene viser autokorrelasjon, antyder dette at noen nøkkelvariabler kan mangle i analysen.
Vil du finne ut mer? Sjekk ut våre praktiske Hva er … -guider!