Tilfældige variabler og sandsynlighedsfordelinger

En tilfældig variabel er en numerisk beskrivelse af resultatet af et statistisk eksperiment. En tilfældig variabel, der kun kan antage et endeligt antal eller en uendelig rækkefølge af værdier siges at være diskret; en, der kan antage en hvilken som helst værdi i et interval på det reelle tal, siges at være kontinuerlig. For eksempel ville en tilfældig variabel, der repræsenterer antallet af biler, der sælges hos en bestemt forhandler på en dag, være diskret, mens en tilfældig variabel, der repræsenterer vægten af en person i kg (eller pund), ville være kontinuerlig.

Læs mere om dette emne
sandsynlighed og statistik: Stigningen af statistikker
I løbet af det 19. århundrede voksede statistik op som statens empiriske videnskab og blev fremtrædende som en form for social viden ….

Sandsynlighedsfordelingen for en tilfældig variabel beskriver, hvordan sandsynlighederne fordeles over værdierne for den tilfældige variabel. For en diskret tilfældig variabel, x, er sandsynlighedsfordelingen defineret af en sandsynlighedsmassefunktion, betegnet med f (x). Denne funktion giver sandsynligheden for hver værdi af den tilfældige variabel. I udviklingen af sandsynlighedsfunktionen for en diskret tilfældig variabel skal to betingelser være opfyldt: (1) f (x) skal ikke være negativ for hver værdi af den tilfældige variabel, og (2) summen af sandsynlighederne for hver værdi af den tilfældige variabel skal være lig med en.

En kontinuerlig tilfældig variabel kan antage en hvilken som helst værdi i et interval på den reelle talelinje eller i en samling af intervaller. Da der er et uendeligt antal værdier i et hvilket som helst interval, er det ikke meningsfuldt at tale om sandsynligheden for, at den tilfældige variabel får en bestemt værdi; i stedet overvejes sandsynligheden for, at en kontinuerlig tilfældig variabel ligger inden for et givet interval.

I det kontinuerlige tilfælde er modstykket til sandsynlighedsmassefunktionen sandsynlighedsdensitetsfunktionen, også betegnet med f (x) . For en kontinuerlig tilfældig variabel tilvejebringer sandsynlighedsdensitetsfunktionen funktionens højde eller værdi ved en bestemt værdi på x; det giver ikke direkte sandsynligheden for, at den tilfældige variabel får en bestemt værdi. Området under grafen for f (x) svarende til noget interval, opnået ved beregning af integralet af f (x) over dette interval, giver imidlertid sandsynligheden for, at variablen vil tage en værdi inden for dette interval. En sandsynlighedsdensitetsfunktion skal tilfredsstille to krav: (1) f (x) skal være ikke-negativ for hver værdi af den tilfældige variabel, og (2) integralet over alle værdierne for den tilfældige variabel skal være lig med en.

Den forventede værdi eller gennemsnit af en tilfældig variabel – betegnet med E (x) eller μ – er et vægtet gennemsnit af de værdier, den tilfældige variabel kan antage. I det diskrete tilfælde er vægten angivet af sandsynlighedsmassefunktionen, og i det kontinuerte tilfælde er vægten givet af sandsynlighedsdensitetsfunktionen. Formlerne til beregning af de forventede værdier af diskrete og kontinuerlige tilfældige variabler er angivet med henholdsvis ligning 2 og 3.

E (x) = Σxf (x) (2)

E (x) = ∫xf (x) dx (3)

Variansen af en tilfældig variabel, betegnet med Var (x) eller σ2, er et vægtet gennemsnit af de kvadratiske afvigelser fra gennemsnittet. I det diskrete tilfælde er vægten angivet af sandsynlighedsmassefunktionen, og i det kontinuerte tilfælde er vægten givet af sandsynlighedsdensitetsfunktionen. Formlerne til beregning af varianterne af diskrete og kontinuerlige tilfældige variabler er givet af henholdsvis ligning 4 og 5. Standardafvigelsen, betegnet σ, er den positive kvadratrod af variansen. Da standardafvigelsen måles i de samme enheder som den tilfældige variabel, og variansen måles i kvadratiske enheder, er standardafvigelsen ofte det foretrukne mål.

Var (x) = σ2 = Σ (x – μ) 2f (x) (4)

Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)

Leave a Reply

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *