O corelație falsă apare atunci când două variabile sunt legate statistic, dar nu direct legate de cauzalitate. Aceste două variabile par a fi legate în mod fals între ele, în mod normal datorită unui al treilea factor nevăzut.
De exemplu, în ultimii 30 de ani prețul biletelor de cinema a crescut și numărul de persoane care participă la cinema a crescut, de asemenea. Cu toate acestea, ar fi o greșeală să concluzionăm că, dacă cinematografele își cresc prețurile, va crește și prezența. De asemenea, ar fi greșit să presupunem că creșterea prețurilor a fost cauzată direct de creșterea ratelor de prezență.
Exemplu de corelație falsă
Fiecare punct din graficul de mai jos arată numărul a deceselor șoferilor în coliziuni feroviare în funcție de an (poziția orizontală) și a importurilor anuale de țiței norvegian de către SUA. Există o corelație puternică evidentă în date cu o statistică de corelație de 0,95. Cu toate acestea, aceasta este o corelație falsă, deoarece nu există niciun motiv să credem că decesele pe calea ferată cauzează importuri de petrol sau invers.
Cauzele corelației false
O cauză a corelațiilor false este coincidența. Dacă arăți suficient de greu, nu există lipsuri de coincidențe în natură. Exemplul specific prezentat mai sus este de pe un site web dedicat găsirii și partajării falsurilor umoristice corelații.
Un tip mai problematic de corelație falsă este acela în care există o relație cauzală, dar nu directă, între cele două variabile. În exemplul anterior de prezențe la cinema și prețuri, prețurile cresc din cauza inflației în timp crește datorită creșterii populației și a nivelurilor mai ridicate de venit disponibil – ambele care apar în timp. Astfel, o a treia variabilă, timpul, „determină” apariția corelației.
Diagnosticarea corelației false
De obicei, este dificil de diagnosticat o corelație falsă, deoarece teoria unei persoane este ano teoria conspirației sau coincidența persoanei respective. Cel mai faimos exemplu recent în acest sens a fost dezbaterea dacă încălzirea globală este o consecință a acțiunilor umane sau nu. În secolul al XX-lea, a avut loc o dezbatere similară cu privire la faptul dacă consumul de tutun a cauzat cancer pulmonar.
Principalul instrument în diagnosticarea dacă o corelație este falsă sau nu este examinarea calității teoriei din spatele acesteia. În cazul tutunului și al cancerului pulmonar, doar o explicație clară a mecanismului biologic care a determinat fumatul să conducă la cancerul pulmonar a soluționat dezbaterea.
O abordare mai bazată pe date pentru diagnosticarea corelației false este utilizarea statisticilor tehnici de examinare a reziduurilor. Dacă reziduurile prezintă autocorelare, acest lucru sugerează că unele variabile cheie pot lipsi din analiză.
Vrei să afli mai multe? Consultați la îndemână Ce este … ghidurile!