En tilfeldig variabel er en numerisk beskrivelse av resultatet av et statistisk eksperiment. En tilfeldig variabel som kan anta bare et endelig tall eller en uendelig rekkefølge av verdier sies å være diskret; en som kan anta en hvilken som helst verdi i et intervall på reell talllinje, sies å være kontinuerlig. For eksempel vil en tilfeldig variabel som representerer antall biler som selges hos en bestemt forhandler på en dag, være diskret, mens en tilfeldig variabel som representerer vekten til en person i kilo (eller pund) vil være kontinuerlig.
Sannsynlighetsfordelingen for en tilfeldig variabel beskriver hvordan sannsynlighetene fordeles over verdiene til den tilfeldige variabelen. For en diskret tilfeldig variabel, x, er sannsynlighetsfordelingen definert av en sannsynlighetsmassefunksjon, betegnet med f (x). Denne funksjonen gir sannsynligheten for hver verdi av den tilfeldige variabelen. I utviklingen av sannsynlighetsfunksjonen for en diskret tilfeldig variabel, må to betingelser være oppfylt: (1) f (x) må ikke være negativ for hver verdi av den tilfeldige variabelen, og (2) summen av sannsynlighetene for hver verdi av den tilfeldige variabelen må være lik en.
En kontinuerlig tilfeldig variabel kan anta hvilken som helst verdi i et intervall på reell tallinje eller i en samling av intervaller. Siden det er uendelig mange verdier i et hvilket som helst intervall, er det ikke meningsfullt å snakke om sannsynligheten for at den tilfeldige variabelen vil ta på seg en bestemt verdi; i stedet vurderes sannsynligheten for at en kontinuerlig tilfeldig variabel vil ligge innenfor et gitt intervall.
I det kontinuerlige tilfellet er motstykket til sannsynlighetsmassefunksjonen sannsynlighetsdensitetsfunksjonen, også betegnet med f (x) . For en kontinuerlig tilfeldig variabel gir sannsynlighetstetthetsfunksjonen høyden eller verdien til funksjonen til en bestemt verdi på x; det gir ikke direkte sannsynligheten for at den tilfeldige variabelen får en spesifikk verdi. Imidlertid gir området under grafen til f (x) som tilsvarer noe intervall, oppnådd ved å beregne integralen av f (x) over det intervallet, sannsynligheten for at variabelen vil ta en verdi innenfor dette intervallet. En sannsynlighetstetthetsfunksjon må tilfredsstille to krav: (1) f (x) må være ikke-negativ for hver verdi av den tilfeldige variabelen, og (2) integralen over alle verdiene til den tilfeldige variabelen må være lik en.
Den forventede verdien eller gjennomsnittet av en tilfeldig variabel – betegnet med E (x) eller μ – er et vektet gjennomsnitt av verdiene den tilfeldige variabelen kan anta. I det diskrete tilfellet er vektene gitt av sannsynlighetsmassefunksjonen, og i kontinuerlig tilfelle er vektene gitt av sannsynlighetstetthetsfunksjonen. Formlene for beregning av forventede verdier for diskrete og kontinuerlige tilfeldige variabler er gitt av henholdsvis ligning 2 og 3.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
Variansen til en tilfeldig variabel, betegnet med Var (x) eller σ2, er et veid gjennomsnitt av de kvadratiske avvikene fra gjennomsnittet. I det diskrete tilfellet er vektene gitt av sannsynlighetsmassefunksjonen, og i kontinuerlig tilfelle er vektene gitt av sannsynlighetstetthetsfunksjonen. Formlene for beregning av avvikene til diskrete og kontinuerlige tilfeldige variabler er gitt av henholdsvis ligning 4 og 5. Standardavviket, betegnet σ, er den positive kvadratroten til variansen. Siden standardavviket måles i de samme enhetene som den tilfeldige variabelen, og avviket måles i kvadratiske enheter, er standardavviket ofte det foretrukne målet.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)