O variabilă aleatorie este o descriere numerică a rezultatului unui experiment statistic. Se spune că o variabilă aleatorie care poate presupune doar un număr finit sau o secvență infinită de valori este discretă; una care poate presupune orice valoare într-un anumit interval pe linia reală se spune că este continuă. De exemplu, o variabilă aleatorie care reprezintă numărul de automobile vândute la o anumită reprezentanță într-o zi ar fi discretă, în timp ce o variabilă aleatorie reprezentând greutatea unei persoane în kilograme (sau lire sterline) ar fi continuă.
Distribuția probabilității pentru o variabilă aleatorie descrie modul în care probabilitățile sunt distribuite peste valorile variabilei aleatoare. Pentru o variabilă discretă aleatorie, x, distribuția probabilității este definită de o funcție de masă a probabilității, notată cu f (x). Această funcție oferă probabilitatea pentru fiecare valoare a variabilei aleatorii. În dezvoltarea funcției de probabilitate pentru o variabilă aleatorie discretă, trebuie îndeplinite două condiții: (1) f (x) trebuie să fie nenegative pentru fiecare valoare a variabilei aleatoare și (2) suma probabilităților pentru fiecare valoare a variabila aleatorie trebuie să fie egală cu una.
O variabilă aleatoare continuă poate presupune orice valoare într-un interval pe linia numerică reală sau într-o colecție de intervale. Deoarece există un număr infinit de valori în orice interval, nu este semnificativ să vorbim despre probabilitatea ca variabila aleatoare să capete o valoare specifică; în schimb, este luată în considerare probabilitatea ca o variabilă continuă aleatorie să se afle într-un interval dat.
În cazul continuu, contrapartida funcției de masă a probabilității este funcția de densitate a probabilității, notată și cu f (x) . Pentru o variabilă continuă aleatorie, funcția densității probabilității oferă înălțimea sau valoarea funcției la orice valoare particulară a lui x; nu dă în mod direct probabilitatea ca variabila aleatorie să ia o anumită valoare. Cu toate acestea, aria de sub graficul lui f (x) corespunzătoare unui anumit interval, obținută prin calcularea integralei lui f (x) peste acel interval, oferă probabilitatea ca variabila să ia o valoare în intervalul respectiv. O funcție de densitate a probabilității trebuie să îndeplinească două cerințe: (1) f (x) trebuie să fie negativă pentru fiecare valoare a variabilei aleatoare și (2) integralul peste toate valorile variabilei aleatoare trebuie să fie egal cu una.
Valoarea așteptată sau media unei variabile aleatorii – notată cu E (x) sau μ – este o medie ponderată a valorilor pe care variația aleatorie le poate asuma. În cazul discret greutățile sunt date de funcția de probabilitate a masei, iar în cazul continuu greutățile sunt date de funcția densității probabilității. Formulele pentru calcularea valorilor așteptate ale variabilelor aleatorii discrete și continue sunt date de ecuațiile 2 și respectiv 3.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
Varianța unei variabile aleatorii, notată cu Var (x) sau σ2, este o medie ponderată a abaterilor pătrate de la medie. În cazul discret greutățile sunt date de funcția de probabilitate a masei, iar în cazul continuu greutățile sunt date de funcția densității probabilității. Formulele pentru calcularea varianțelor variabilelor aleatorii discrete și continue sunt date de ecuațiile 4 și respectiv 5. Abaterea standard, notată σ, este rădăcina pătrată pozitivă a varianței. Deoarece abaterea standard este măsurată în aceleași unități ca variabila aleatorie și varianța este măsurată în unități pătrate, abaterea standard este adesea măsura preferată.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)