1.3.5.11. Mått på snedhet och kurtos

För univariata data Y1, Y2, …, YN är formeln för snedhet:

    \

där \ (\ bar {Y} \) är teman, s är standardavvikelse och N är antalet datapunkter. Observera att vid beräkning av snedheten beräknas s med N i nämnaren snarare än N – 1.

Ovanstående formel för snedhet kallas Fisher-Pearson-koefficienten för snedhet. Många program beräknar faktiskt den justerade Fisher-Pearson-koefficienten för snedhet

    \

Detta är en justering för provstorlek. Justeringen närmar sig 1 när N blir stor. Som referens är justeringsfaktorn1,49 för N = 5, 1,19 för N = 10, 1,08 för N = 20,1,05 för N = 30 och 1,02 för N = 100.

Snedheten för en normalfördelning är noll och alla symmetriska data bör ha en snedhet nära noll. Negativa värden för snedställningen indikerar data som är sneda åt vänster och positiva värden för snedheten anger data som är sneda åt höger. Med sned åt vänster, avlägsna att vänster svans är lång i förhållande till höger svans. På samma sätt betyder sned åt höger att höger svans är lång i förhållande till vänster svans. Om uppgifterna är multimodala kan detta påverka tecknet på skärhet.

Vissa mätningar har en nedre gräns och är sneda rätt. Exempelvis, i tillförlitlighetsstudier kan misslyckandetider inte vara negativa.

Det bör noteras att det finns alternativa definitioner av skevhet i litteraturen. Till exempel definieras Galton-skevhet (även känd som Bowleys skevhet) som

    \

där Q1 är den nedre kvartilen, Q3 är den övre kvartilen och Q2 är medianen.

Pearson 2 skevhetskoefficienten definieras som

    \

där \ (\ tilde {Y} \) är medianvärdet för provet.

Det finns många andra definitioner för skevhet som inte diskuteras här .

Leave a Reply

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *