En slumpmässig variabel är en numerisk beskrivning av resultatet av ett statistiskt experiment. En slumpmässig variabel som endast kan anta ett ändligt tal eller en oändlig värdesekvens sägs vara diskret; ett som kan anta vilket värde som helst i något intervall på den verkliga talraden sägs vara kontinuerligt. Till exempel skulle en slumpmässig variabel som representerar antalet bilar som säljs på en viss återförsäljare på en dag vara diskret, medan en slumpmässig variabel som representerar vikten av en person i kg (eller pund) skulle vara kontinuerlig.
Sannolikhetsfördelningen för en slumpmässig variabel beskriver hur sannolikheterna fördelas över värdena för den slumpmässiga variabeln. För en diskret slumpmässig variabel, x, definieras sannolikhetsfördelningen av en sannolikhetsmassfunktion, betecknad med f (x). Denna funktion ger sannolikheten för varje värde i den slumpmässiga variabeln. Vid utvecklingen av sannolikhetsfunktionen för en diskret slumpmässig variabel måste två villkor vara uppfyllda: (1) f (x) måste vara icke-negativ för varje värde av den slumpmässiga variabeln och (2) summan av sannolikheterna för varje värde av den slumpmässiga variabeln måste vara lika med en.
En kontinuerlig slumpmässig variabel kan anta vilket värde som helst i ett intervall på den verkliga talraden eller i en samling intervaller. Eftersom det finns ett oändligt antal värden i vilket intervall som helst är det inte meningsfullt att prata om sannolikheten för att den slumpmässiga variabeln kommer att ta ett specifikt värde; istället beaktas sannolikheten att en kontinuerlig slumpmässig variabel ligger inom ett givet intervall.
I det kontinuerliga fallet är motsvarigheten till sannolikhetsfunktionen sannolikhetsdensitetsfunktionen, också betecknad med f (x) . För en kontinuerlig slumpmässig variabel tillhandahåller sannolikhetsdensitetsfunktionen funktionens höjd eller värde vid ett visst värde av x; det ger inte direkt sannolikheten för att den slumpmässiga variabeln tar ett specifikt värde. Området under diagrammet för f (x) motsvarande något intervall, erhållet genom att beräkna integralen av f (x) över det intervallet, ger dock sannolikheten att variabeln kommer att ta ett värde inom detta intervall. En sannolikhetsdensitetsfunktion måste uppfylla två krav: (1) f (x) måste vara icke-negativ för varje värde i den slumpmässiga variabeln, och (2) integralen över alla värden i den slumpmässiga variabeln måste vara lika med ett.
Det förväntade värdet, eller medelvärdet, av en slumpmässig variabel – betecknad med E (x) eller μ – är ett viktat medelvärde av de värden som den slumpmässiga variabeln kan anta. I det diskreta fallet ges vikterna av sannolikhetsmassfunktionen, och i det kontinuerliga fallet ges vikterna av sannolikhetsdensitetsfunktionen. Formlerna för beräkning av de förväntade värdena för diskreta och kontinuerliga slumpmässiga variabler ges av ekvationerna 2 respektive 3.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
Variansen för en slumpmässig variabel, betecknad med Var (x) eller σ2, är ett viktat medelvärde av de kvadrerade avvikelserna från medelvärdet. I det diskreta fallet ges vikterna av sannolikhetsmassfunktionen, och i det kontinuerliga fallet ges vikterna av sannolikhetsdensitetsfunktionen. Formlerna för beräkning av avvikelserna för diskreta och kontinuerliga slumpmässiga variabler ges av ekvationerna 4 respektive 5. Standardavvikelsen, betecknad σ, är den positiva kvadratroten av variansen. Eftersom standardavvikelsen mäts i samma enheter som den slumpmässiga variabeln och variansen mäts i kvadratiska enheter är standardavvikelsen ofta det föredragna måttet.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)