Per i dati univariati Y1, Y2, …, YN, la formula per l’asimmetria è:
- \
dove \ (\ bar {Y} \) è il valore medio, s è la deviazione standard e N è il numero di punti dati. Si noti che nel calcolo dell’asimmetria, la s è calcolata con N nel nominatore anziché con N – 1.
La formula precedente per l’asimmetria è indicata come il coefficiente di asimmetria di Fisher-Pearson. Molti programmi software calcolano effettivamente il coefficiente di asimmetria di Fisher-Pearson regolato
- \
Questo è un aggiustamento per la dimensione del campione. L’aggiustamento si avvicina a 1 all’aumentare di N. Per riferimento, il fattore di aggiustamento è 1,49 per N = 5, 1,19 per N = 10, 1,08 per N = 20,1,05 per N = 30 e 1,02 per N = 100.
L’asimmetria per una distribuzione normale è zero e qualsiasi dato simmetrico dovrebbe avere un’asimmetria prossima allo zero. I valori negativi per l’asimmetria indicano i dati che sono inclinati a sinistra ei valori positivi per l’asimmetria indicano i dati che sono inclinati a destra. Se inclinato a sinistra, possiamo dire che la coda sinistra è lunga rispetto alla coda destra. Allo stesso modo, inclinato a destra significa che la coda destra è lunga rispetto alla coda sinistra. Se i dati sono multimodali, questo potrebbe influenzare il segno dell’asimmetria.
Alcune misurazioni hanno un limite inferiore e sono distorte giusto. Ad esempio, negli studi sull’affidabilità, i tempi di fallimento non possono essere negativi.
Va notato che esistono definizioni alternative di asimmetria nella letteratura. Ad esempio, l’asimmetria di Galton (nota anche come asimmetria di Bowley) è definita come
- \
dove Q1 è il quartile inferiore, Q3 è il quartile superiore e Q2 è la mediana.
Il coefficiente di asimmetria di Pearson 2 è definito come
- \
dove \ (\ tilde {Y} \) è la mediana del campione.
Ci sono molte altre definizioni di asimmetria che non verranno discusse qui .