Una variabile casuale è una descrizione numerica del risultato di un esperimento statistico. Si dice che una variabile casuale che può assumere solo un numero finito o una sequenza infinita di valori sia discreta; uno che può assumere qualsiasi valore in un intervallo sulla linea del numero reale è detto continuo. Ad esempio, una variabile casuale che rappresenta il numero di automobili vendute in un particolare concessionario in un giorno sarebbe discreta, mentre una variabile casuale che rappresenta il peso di una persona in chilogrammi (o libbre) sarebbe continua.
La distribuzione di probabilità per una variabile casuale descrive come le probabilità sono distribuite sui valori della variabile casuale. Per una variabile casuale discreta, x, la distribuzione di probabilità è definita da una funzione di massa di probabilità, indicata con f (x). Questa funzione fornisce la probabilità per ogni valore della variabile casuale. Nello sviluppo della funzione di probabilità per una variabile casuale discreta, devono essere soddisfatte due condizioni: (1) f (x) deve essere non negativo per ogni valore della variabile casuale e (2) la somma delle probabilità per ogni valore di la variabile casuale deve essere uguale a uno.
Una variabile casuale continua può assumere qualsiasi valore in un intervallo sulla linea del numero reale o in una raccolta di intervalli. Poiché esiste un numero infinito di valori in ogni intervallo, non ha senso parlare della probabilità che la variabile casuale assuma un valore specifico; viene invece considerata la probabilità che una variabile casuale continua si trovi all’interno di un dato intervallo.
Nel caso continuo, la controparte della funzione di massa di probabilità è la funzione di densità di probabilità, indicata anche da f (x) . Per una variabile casuale continua, la funzione di densità di probabilità fornisce l’altezza o il valore della funzione a qualsiasi valore particolare di x; non fornisce direttamente la probabilità che la variabile casuale assuma un valore specifico. Tuttavia, l’area sotto il grafico di f (x) corrispondente a un intervallo, ottenuta calcolando l’integrale di f (x) su quell’intervallo, fornisce la probabilità che la variabile assumerà un valore all’interno di quell’intervallo. Una funzione di densità di probabilità deve soddisfare due requisiti: (1) f (x) deve essere non negativo per ogni valore della variabile casuale e (2) l’integrale su tutti i valori della variabile casuale deve essere uguale a uno.
Il valore atteso, o media, di una variabile casuale, indicato con E (x) o μ, è una media ponderata dei valori che la variabile casuale può assumere. Nel caso discreto i pesi sono dati dalla funzione massa di probabilità, e nel caso continuo i pesi sono dati dalla funzione densità di probabilità. Le formule per calcolare i valori attesi delle variabili casuali discrete e continue sono date rispettivamente dalle equazioni 2 e 3.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
La varianza di una variabile casuale, indicata con Var (x) o σ2, è una media ponderata delle deviazioni quadrate dalla media. Nel caso discreto i pesi sono dati dalla funzione massa di probabilità, e nel caso continuo i pesi sono dati dalla funzione densità di probabilità. Le formule per calcolare le varianze di variabili aleatorie discrete e continue sono date rispettivamente dalle equazioni 4 e 5. La deviazione standard, indicata con σ, è la radice quadrata positiva della varianza. Poiché la deviazione standard è misurata nelle stesse unità della variabile casuale e la varianza è misurata in unità al quadrato, la deviazione standard è spesso la misura preferita.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)