Una variable aleatoria es una descripción numérica del resultado de un experimento estadístico. Se dice que una variable aleatoria que puede asumir sólo un número finito o una secuencia infinita de valores es discreta; uno que puede asumir cualquier valor en algún intervalo en la recta numérica real se dice que es continuo. Por ejemplo, una variable aleatoria que represente el número de automóviles vendidos en un concesionario en particular en un día sería discreta, mientras que una variable aleatoria que represente el peso de una persona en kilogramos (o libras) sería continua.
La distribución de probabilidad para una variable aleatoria describe cómo se distribuyen las probabilidades sobre los valores de la variable aleatoria. Para una variable aleatoria discreta, x, la distribución de probabilidad está definida por una función de masa de probabilidad, denotada por f (x). Esta función proporciona la probabilidad de cada valor de la variable aleatoria. En el desarrollo de la función de probabilidad para una variable aleatoria discreta, se deben cumplir dos condiciones: (1) f (x) debe ser no negativo para cada valor de la variable aleatoria, y (2) la suma de las probabilidades para cada valor de la variable aleatoria debe ser igual a uno.
Una variable aleatoria continua puede asumir cualquier valor en un intervalo en la recta numérica real o en una colección de intervalos. Dado que hay un número infinito de valores en cualquier intervalo, no tiene sentido hablar de la probabilidad de que la variable aleatoria adopte un valor específico; en cambio, se considera la probabilidad de que una variable aleatoria continua se encuentre dentro de un intervalo dado.
En el caso continuo, la contraparte de la función de masa de probabilidad es la función de densidad de probabilidad, también denotada por f (x) . Para una variable aleatoria continua, la función de densidad de probabilidad proporciona la altura o el valor de la función en cualquier valor particular de x; no da directamente la probabilidad de que la variable aleatoria tome un valor específico. Sin embargo, el área bajo la gráfica de f (x) correspondiente a algún intervalo, obtenida al calcular la integral de f (x) sobre ese intervalo, proporciona la probabilidad de que la variable tome un valor dentro de ese intervalo. Una función de densidad de probabilidad debe satisfacer dos requisitos: (1) f (x) debe ser no negativo para cada valor de la variable aleatoria y (2) la integral sobre todos los valores de la variable aleatoria debe ser igual a uno.
El valor esperado, o media, de una variable aleatoria, denotado por E (x) o μ, es un promedio ponderado de los valores que la variable aleatoria puede asumir. En el caso discreto, los pesos vienen dados por la función de masa de probabilidad, y en el caso continuo los pesos vienen dados por la función de densidad de probabilidad. Las fórmulas para calcular los valores esperados de variables aleatorias discretas y continuas vienen dadas por las ecuaciones 2 y 3, respectivamente.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
La varianza de una variable aleatoria, denotada por Var (x) o σ2, es un promedio ponderado de las desviaciones al cuadrado de la media. En el caso discreto, los pesos vienen dados por la función de masa de probabilidad, y en el caso continuo los pesos vienen dados por la función de densidad de probabilidad. Las fórmulas para calcular las varianzas de variables aleatorias discretas y continuas vienen dadas por las ecuaciones 4 y 5, respectivamente. La desviación estándar, denotada σ, es la raíz cuadrada positiva de la varianza. Dado que la desviación estándar se mide en las mismas unidades que la variable aleatoria y la varianza se mide en unidades al cuadrado, la desviación estándar es a menudo la medida preferida.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)