Eine falsche Korrelation tritt auf, wenn zwei Variablen statistisch, aber nicht direkt kausal zusammenhängen. Diese beiden Variablen scheinen fälschlicherweise miteinander in Beziehung zu stehen, normalerweise aufgrund eines unsichtbaren dritten Faktors.
Beispielsweise ist in den letzten 30 Jahren der Preis für Kinokarten gestiegen und die Anzahl gestiegen Die Zahl der Kinobesucher ist ebenfalls gestiegen. Es wäre jedoch ein Fehler zu folgern, dass die Besucherzahlen ebenfalls steigen werden, wenn Kinos ihre Preise erhöhen. Ebenso wäre es falsch anzunehmen, dass der Preisanstieg direkt durch den Anstieg der Anwesenheitsraten verursacht wurde.
Beispiel für eine falsche Korrelation
Jeder Punkt in der folgenden Tabelle zeigt die Anzahl der Todesfälle von Fahrern bei Eisenbahnkollisionen pro Jahr (horizontale Position) und der jährlichen Importe von norwegischem Rohöl durch die USA. In den Daten ist eine starke Korrelation mit einer Korrelationsstatistik von 0,95 erkennbar. Dies ist jedoch eine falsche Korrelation, da es keinen Grund zu der Annahme gibt, dass Eisenbahntodesfälle Ölimporte verursachen oder umgekehrt.
Ursachen für falsche Korrelationen
Eine Ursache für falsche Korrelationen ist der Zufall. Wenn Sie genau hinschauen, gibt es keinen Mangel an Zufällen in der Natur. Das oben gezeigte spezifische Beispiel stammt von einer Website, die sich dem Auffinden und Teilen von humorvollen falschen Werten widmet Korrelationen.
Eine problematischere Art der falschen Korrelation ist eine, bei der eine kausale, aber nicht direkte Beziehung zwischen den beiden Variablen besteht. Im früheren Beispiel für Kinobesuche und Preise steigen die Preise aufgrund der Inflation während des Besuchs steigt aufgrund des Bevölkerungswachstums und eines höheren verfügbaren Einkommens – beide treten im Laufe der Zeit auf. Somit „bewirkt“ eine dritte Variable, die Zeit, dass die Korrelation auftritt.
Diagnose einer falschen Korrelation
Es ist normalerweise schwierig, eine falsche Korrelation zu diagnostizieren, da die Theorie einer Person ano ist Verschwörungstheorie oder Zufall der anderen Person. Das bekannteste Beispiel in jüngster Zeit war die Debatte darüber, ob die globale Erwärmung eine Folge menschlichen Handelns ist oder nicht. Im 20. Jahrhundert gab es eine ähnliche Debatte darüber, ob Tabakkonsum Lungenkrebs verursacht.
Das Hauptinstrument bei der Diagnose, ob eine Korrelation falsch ist oder nicht, besteht darin, die Qualität der dahinter stehenden Theorie zu untersuchen. Im Fall von Tabak- und Lungenkrebs hat nur eine klare Erklärung für den biologischen Mechanismus, der das Rauchen zu Lungenkrebs führte, die Debatte beigelegt.
Ein datengesteuerterer Ansatz zur Diagnose von Störkorrelationen ist die Verwendung statistischer Daten Techniken zur Untersuchung der Residuen. Wenn die Residuen eine Autokorrelation aufweisen, deutet dies darauf hin, dass möglicherweise eine Schlüsselvariable in der Analyse fehlt.
Möchten Sie mehr erfahren? Schauen Sie sich unsere praktischen Was ist … Anleitungen an!