Een willekeurige variabele is een numerieke beschrijving van de uitkomst van een statistisch experiment. Een willekeurige variabele die alleen een eindig aantal of een oneindige reeks waarden kan aannemen, wordt discreet genoemd; een die elke waarde kan aannemen in een bepaald interval op de reële getallenlijn wordt continu genoemd. Een willekeurige variabele die het aantal auto’s vertegenwoordigt dat op een dag bij een bepaalde dealer is verkocht, zou bijvoorbeeld discreet zijn, terwijl een willekeurige variabele die het gewicht van een persoon in kilogrammen (of ponden) weergeeft, continu zou zijn.
De kansverdeling voor een willekeurige variabele beschrijft hoe de kansen worden verdeeld over de waarden van de willekeurige variabele. Voor een discrete willekeurige variabele, x, wordt de kansverdeling bepaald door een kansmassafunctie, aangeduid met f (x). Deze functie geeft de waarschijnlijkheid voor elke waarde van de willekeurige variabele. Bij de ontwikkeling van de kansfunctie voor een discrete willekeurige variabele moet aan twee voorwaarden worden voldaan: (1) f (x) moet niet-negatief zijn voor elke waarde van de willekeurige variabele, en (2) de som van de kansen voor elke waarde van de willekeurige variabele moet gelijk zijn aan één.
Een continue willekeurige variabele kan elke waarde aannemen in een interval op de reële getallenlijn of in een verzameling intervallen. Aangezien er in elk interval een oneindig aantal waarden is, heeft het geen zin om te praten over de waarschijnlijkheid dat de willekeurige variabele een specifieke waarde zal aannemen; in plaats daarvan wordt rekening gehouden met de kans dat een continue willekeurige variabele binnen een bepaald interval zal liggen.
In het continue geval is de tegenhanger van de kansmassafunctie de kansdichtheidsfunctie, ook aangeduid met f (x) . Voor een continue willekeurige variabele geeft de kansdichtheidsfunctie de hoogte of waarde van de functie bij een bepaalde waarde van x; het geeft niet direct de kans dat de willekeurige variabele een specifieke waarde aanneemt. Het gebied onder de grafiek van f (x) dat overeenkomt met een bepaald interval, verkregen door de integraal van f (x) over dat interval te berekenen, geeft echter de kans dat de variabele een waarde zal aannemen binnen dat interval. Een kansdichtheidsfunctie moet aan twee vereisten voldoen: (1) f (x) moet niet-negatief zijn voor elke waarde van de willekeurige variabele, en (2) de integraal over alle waarden van de willekeurige variabele moet gelijk zijn aan één.
De verwachte waarde, of het gemiddelde, van een willekeurige variabele – aangegeven met E (x) of μ – is een gewogen gemiddelde van de waarden die de willekeurige variabele mag aannemen. In het discrete geval worden de gewichten gegeven door de kansdichtheidsfunctie, en in het continue geval worden de gewichten gegeven door de kansdichtheidsfunctie. De formules voor het berekenen van de verwachte waarden van discrete en continue willekeurige variabelen worden gegeven door respectievelijk vergelijking 2 en 3.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
De variantie van een willekeurige variabele, aangeduid met Var (x) of σ2, is een gewogen gemiddelde van de kwadratische afwijkingen van het gemiddelde. In het discrete geval worden de gewichten gegeven door de kansmassafunctie, en in het continue geval worden de gewichten gegeven door de kansdichtheidsfunctie. De formules voor het berekenen van de varianties van discrete en continue willekeurige variabelen worden gegeven door respectievelijk vergelijkingen 4 en 5. De standaarddeviatie, aangeduid met σ, is de positieve vierkantswortel van de variantie. Aangezien de standaarddeviatie wordt gemeten in dezelfde eenheden als de willekeurige variabele en de variantie wordt gemeten in kwadraateenheden, heeft de standaarddeviatie vaak de voorkeur.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)