Se produce una correlación falsa cuando dos variables están relacionadas estadísticamente pero no directamente de manera causal. Estas dos variables parecen estar falsamente relacionadas entre sí, normalmente debido a un tercer factor invisible.
Por ejemplo, durante los últimos 30 años el precio de las entradas al cine ha aumentado y el número de personas que asisten al cine también ha aumentado. Sin embargo, sería un error concluir que si los cines suben sus precios, la asistencia también aumentará. Del mismo modo, sería incorrecto suponer que el aumento de los precios fue causado directamente por el aumento en las tasas de asistencia.
Ejemplo de correlación espuria
Cada punto en el cuadro a continuación muestra el número de muertes de conductores en colisiones ferroviarias por año (la posición horizontal), y las importaciones anuales de petróleo crudo noruego por parte de EE. UU. Existe una fuerte correlación evidente en los datos con una estadística de correlación de 0,95. Sin embargo, esta es una correlación falsa porque no hay razón para creer que las muertes por ferrocarril causen importaciones de petróleo, o viceversa.
Causas de correlación espuria
Una causa de correlación espuria es la coincidencia. Si miras lo suficiente, no hay escasez de coincidencias en la naturaleza. El ejemplo específico que se muestra arriba es de un sitio web dedicado a encontrar y compartir espurios humorísticos correlaciones.
Un tipo más problemático de correlación espuria es aquella en la que existe una relación causal, pero no directa, entre las dos variables. En el ejemplo anterior de asistencia al cine y precios, los precios suben debido a la inflación mientras que la asistencia aumenta debido al crecimiento de la población y los niveles más altos de ingresos disponibles, ambos ocurren con el tiempo. Por lo tanto, una tercera variable, el tiempo, «hace» que aparezca la correlación.
Diagnóstico de correlación espuria
Por lo general, es difícil diagnosticar una correlación espuria, ya que la teoría de una persona es diferente. teoría de la conspiración o coincidencia de otra persona. El ejemplo reciente más famoso de esto fue el debate sobre si el calentamiento global es una consecuencia de las acciones humanas o no. En el siglo XX, se produjo un debate similar sobre si el consumo de tabaco causaba cáncer de pulmón.
La principal herramienta para diagnosticar si una correlación es falsa o no es examinar la calidad de la teoría que la sustenta. En el caso del tabaco y el cáncer de pulmón, solo una explicación clara del mecanismo biológico que provocó que el tabaquismo condujera al cáncer de pulmón resolvió el debate.
Un enfoque más basado en datos para diagnosticar la correlación espuria es utilizar estadísticas técnicas para examinar los residuos. Si los residuos exhiben autocorrelación, esto sugiere que alguna variable clave puede faltar en el análisis.
¿Quiere saber más? Echa un vistazo a nuestras prácticas guías ¿Qué es …?