Para datos univariados Y1, Y2, …, YN, la fórmula para la asimetría es:
- \
donde \ (\ bar {Y} \) es mean, s es la desviación estándar y N es el número de puntos de datos. Tenga en cuenta que al calcular la asimetría, s se calcula con N en el denominador en lugar de N – 1.
La fórmula anterior para la asimetría se denomina coeficiente de asimetría de Fisher-Pearson. Muchos programas de software calculan realmente el coeficiente de asimetría de Fisher-Pearson ajustado
- \
Este es un ajuste para el tamaño de la muestra. El ajuste se aproxima a 1 a medida que N aumenta. Como referencia, el factor de ajuste es 1,49 para N = 5, 1,19 para N = 10, 1,08 para N = 20, 1,05 para N = 30 y 1,02 para N = 100.
La asimetría para una distribución normal es cero y cualquier dato simétrico debe tener un sesgo cercano a cero. Los valores negativos para la asimetría indican datos sesgados hacia la izquierda y los valores positivos para la asimetría indican datos sesgados hacia la derecha. Por sesgado a la izquierda, queremos decir que la cola izquierda es larga en relación con la cola derecha. De manera similar, sesgado a la derecha significa que la cola derecha es larga en relación con la cola izquierda. Si los datos son multimodales, esto puede afectar el signo de la asimetría.
Algunas medidas tienen un límite inferior y están sesgadas. derecho. Por ejemplo, en estudios de confiabilidad, los tiempos de falla no pueden ser negativos.
Cabe señalar que existen definiciones alternativas de asimetría en la literatura. Por ejemplo, la asimetría de Galton (también conocida como asimetría de Bowley) se define como
- \
donde Q1 es el cuartil inferior, Q3 es el cuartil superior y Q2 es la mediana.
El coeficiente de asimetría de Pearson 2 se define como
- \
donde \ (\ tilde {Y} \) es la mediana de la muestra.
Hay muchas otras definiciones de asimetría que no se discutirán aquí .