1.3.5.11. Tiltak for skjevhet og kurtose

For univariate data Y1, Y2, …, YN, er formelen for skjevhet:

    \

der \ (\ bar {Y} \) er tematisk, s er standardavvik, og N er antall datapunkter. Merk at i beregning av skjevhet blir s beregnet med N i nevneren snarere enn N – 1.

Ovenstående formel for skjevhet blir referert til som Fisher-Pearson-koeffisienten for skjevhet. Mange programmer beregner faktisk den justerte Fisher-Pearson-koeffisienten for skjevhet

    \

Dette er en justering for prøvestørrelsen. Justeringen nærmer seg 1 ettersom N blir stor. Som referanse er justeringsfaktoren1,49 for N = 5, 1,19 for N = 10, 1,08 for N = 20,1,05 for N = 30 og 1,02 for N = 100.

Skjevheten for en normalfordeling er null , og eventuelle symmetriske data skal ha en skjevhet nær null. Negative verdier for skjevheten indikerer data som er skjev til venstre og positive verdier for skjevheten indikerer data som er skjev til høyre. Ved skjeve venstre, kvinne at venstre hale er lang i forhold til høyre hale. På samme måte betyr skjeve høyre at høyre hale er lang i forhold til venstre hale. Hvis dataene er multimodale, kan dette påvirke tegnet på skikkethet.

Noen målinger har en nedre grense og er skjevt Ikke sant. For eksempel, i pålitelighetsstudier, kan ikke sviktstider være negative.

Det bør bemerkes at det er alternative definisjoner av skjevhet i litteraturen. For eksempel er Galton skjevhet (også kjent som Bowleys skjevhet) definert som

    \

der Q1 er den nedre kvartilen, Q3 er den øvre kvartilen, og Q2 er medianen.

Pearson 2-skjevhetskoeffisienten er definert som

    \

hvor \ (\ tilde {Y} \) er medianen på prøven.

Det er mange andre definisjoner for skjevhet som ikke blir diskutert her .

Leave a Reply

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *