Voor univariate gegevens Y1, Y2, …, YN is de formule voor scheefheid:
- \
waarbij \ (\ balk {Y} \) themaan is, s de standaarddeviatie is en N het aantal datapunten is. Merk op dat bij het berekenen van de scheefheid, de s wordt berekend met N in de noemer in plaats van N – 1.
De bovenstaande formule voor scheefheid wordt de Fisher-Pearson-scheefheidscoëfficiënt genoemd. Veel softwareprogramma’s berekenen feitelijk de aangepaste Fisher-Pearson-scheefheidscoëfficiënt.
- \
Dit is een aanpassing voor de steekproefomvang. De aanpassing nadert1 naarmate N groot wordt. Ter referentie: de correctiefactor is 1,49 voor N = 5, 1,19 voor N = 10, 1,08 voor N = 20,1,05 voor N = 30 en 1,02 voor N = 100.
De scheefheid voor een normale verdeling is nul , en alle symmetrische gegevens moeten een scheefheid hebben die bijna nul is. Negatieve waarden voor de scheefheid geven gegevens aan die naar links zijn verschoven en positieve waarden voor de scheefheid geven gegevens aan die naar rechts zijn verschoven. Door naar links te schuiven, betekent dit dat de linker staart lang is ten opzichte van de rechter staart. Evenzo betekent scheef naar rechts dat de rechterstaart lang is ten opzichte van de linkerstaart. Als de gegevens multimodaal zijn, kan dit het teken van scheefheid beïnvloeden.
Sommige metingen hebben een ondergrens en zijn scheef Rechtsaf. In betrouwbaarheidsstudies kunnen mislukkingen bijvoorbeeld niet negatief zijn.
Opgemerkt moet worden dat er alternatieve definities van scheefheid in de literatuur zijn. De scheefheid van Galton (ook bekend als Bowley’s scheefheid) wordt bijvoorbeeld gedefinieerd als
- \
waarbij Q1 het onderste kwartiel is, Q3 het bovenste kwartiel en Q2 de mediaan.
De Pearson 2 scheefheidscoëfficiënt is gedefinieerd als
- \
waarbij \ (\ tilde {Y} \) de steekproefmediaan is.
Er zijn veel andere definities voor scheefheid die hier niet zullen worden besproken .