Uma variável aleatória é uma descrição numérica do resultado de um experimento estatístico. Uma variável aleatória que pode assumir apenas um número finito ou uma seqüência infinita de valores é considerada discreta; aquele que pode assumir qualquer valor em algum intervalo na reta do número real é considerado contínuo. Por exemplo, uma variável aleatória representando o número de automóveis vendidos em uma determinada concessionária em um dia seria discreta, enquanto uma variável aleatória representando o peso de uma pessoa em quilogramas (ou libras) seria contínua.
A distribuição de probabilidade de uma variável aleatória descreve como as probabilidades são distribuídas sobre os valores da variável aleatória. Para uma variável aleatória discreta, x, a distribuição de probabilidade é definida por uma função de massa de probabilidade, denotada por f (x). Esta função fornece a probabilidade de cada valor da variável aleatória. No desenvolvimento da função de probabilidade para uma variável aleatória discreta, duas condições devem ser satisfeitas: (1) f (x) deve ser não negativo para cada valor da variável aleatória, e (2) a soma das probabilidades para cada valor de a variável aleatória deve ser igual a um.
Uma variável aleatória contínua pode assumir qualquer valor em um intervalo na reta do número real ou em uma coleção de intervalos. Como existe um número infinito de valores em qualquer intervalo, não faz sentido falar sobre a probabilidade de a variável aleatória assumir um valor específico; em vez disso, é considerada a probabilidade de uma variável aleatória contínua estar dentro de um determinado intervalo.
No caso contínuo, a contraparte da função de massa de probabilidade é a função de densidade de probabilidade, também denotada por f (x) . Para uma variável aleatória contínua, a função de densidade de probabilidade fornece a altura ou o valor da função em qualquer valor particular de x; não fornece diretamente a probabilidade da variável aleatória assumir um valor específico. No entanto, a área sob o gráfico de f (x) correspondente a algum intervalo, obtida pelo cálculo da integral de f (x) sobre esse intervalo, fornece a probabilidade de que a variável assumirá um valor dentro desse intervalo. Uma função de densidade de probabilidade deve satisfazer dois requisitos: (1) f (x) deve ser não negativo para cada valor da variável aleatória e (2) a integral sobre todos os valores da variável aleatória deve ser igual a um.
O valor esperado, ou média, de uma variável aleatória – denotada por E (x) ou μ – é uma média ponderada dos valores que a variável aleatória pode assumir. No caso discreto, os pesos são dados pela função de probabilidade de massa e, no caso contínuo, os pesos são dados pela função de densidade de probabilidade. As fórmulas para calcular os valores esperados de variáveis aleatórias discretas e contínuas são dadas pelas equações 2 e 3, respectivamente.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
A variância de uma variável aleatória, denotada por Var (x) ou σ2, é uma média ponderada dos desvios quadrados da média. No caso discreto, os pesos são dados pela função de probabilidade de massa e, no caso contínuo, os pesos são dados pela função de densidade de probabilidade. As fórmulas para calcular as variâncias de variáveis aleatórias discretas e contínuas são dadas pelas equações 4 e 5, respectivamente. O desvio padrão, denotado por σ, é a raiz quadrada positiva da variância. Uma vez que o desvio padrão é medido nas mesmas unidades que a variável aleatória e a variância é medida em unidades quadradas, o desvio padrão é frequentemente a medida preferida.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)