Une variable aléatoire est une description numérique du résultat d’une expérience statistique. Une variable aléatoire qui ne peut supposer qu’un nombre fini ou une séquence infinie de valeurs est dite discrète; celui qui peut prendre n’importe quelle valeur dans un certain intervalle sur la droite numérique réelle est dit continu. Par exemple, une variable aléatoire représentant le nombre d’automobiles vendues chez un concessionnaire particulier au cours d’une journée serait discrète, tandis qu’une variable aléatoire représentant le poids d’une personne en kilogrammes (ou livres) serait continue.
La distribution de probabilité pour une variable aléatoire décrit comment les probabilités sont réparties sur les valeurs de la variable aléatoire. Pour une variable aléatoire discrète, x, la distribution de probabilité est définie par une fonction de masse de probabilité, notée f (x). Cette fonction fournit la probabilité pour chaque valeur de la variable aléatoire. Dans le développement de la fonction de probabilité pour une variable aléatoire discrète, deux conditions doivent être satisfaites: (1) f (x) doit être non négatif pour chaque valeur de la variable aléatoire, et (2) la somme des probabilités pour chaque valeur de la variable aléatoire doit être égale à un.
Une variable aléatoire continue peut prendre n’importe quelle valeur dans un intervalle sur la droite numérique réelle ou dans une collection d’intervalles. Puisqu’il y a un nombre infini de valeurs dans n’importe quel intervalle, il n’est pas significatif de parler de la probabilité que la variable aléatoire prenne une valeur spécifique; au lieu de cela, la probabilité qu’une variable aléatoire continue se trouve dans un intervalle donné est considérée.
Dans le cas continu, la contrepartie de la fonction de masse de probabilité est la fonction de densité de probabilité, également notée f (x) . Pour une variable aléatoire continue, la fonction de densité de probabilité fournit la hauteur ou la valeur de la fonction à une valeur particulière de x; il ne donne pas directement la probabilité que la variable aléatoire prenne une valeur spécifique. Cependant, l’aire sous le graphique de f (x) correspondant à un certain intervalle, obtenue en calculant l’intégrale de f (x) sur cet intervalle, fournit la probabilité que la variable prenne une valeur dans cet intervalle. Une fonction de densité de probabilité doit satisfaire à deux exigences: (1) f (x) doit être non négatif pour chaque valeur de la variable aléatoire, et (2) l’intégrale sur toutes les valeurs de la variable aléatoire doit être égale à un.
La valeur attendue, ou moyenne, d’une variable aléatoire – notée E (x) ou μ – est une moyenne pondérée des valeurs que la variable aléatoire peut prendre. Dans le cas discret, les poids sont donnés par la fonction de probabilité de masse, et dans le cas continu, les poids sont donnés par la fonction de densité de probabilité. Les formules de calcul des valeurs attendues des variables aléatoires discrètes et continues sont données par les équations 2 et 3, respectivement.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
La variance d’une variable aléatoire, notée Var (x) ou σ2, est une moyenne pondérée des écarts au carré de la moyenne. Dans le cas discret, les poids sont donnés par la fonction de probabilité de masse, et dans le cas continu, les poids sont donnés par la fonction de densité de probabilité. Les formules de calcul des variances des variables aléatoires discrètes et continues sont données par les équations 4 et 5, respectivement. L’écart type, noté σ, est la racine carrée positive de la variance. Étant donné que l’écart-type est mesuré dans les mêmes unités que la variable aléatoire et que la variance est mesurée en unités au carré, l’écart-type est souvent la mesure préférée.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)