Zmienna losowa to numeryczny opis wyniku eksperymentu statystycznego. O zmiennej losowej, która może przyjmować tylko skończoną liczbę lub nieskończoną sekwencję wartości, mówi się, że jest dyskretna; taki, który może przyjąć dowolną wartość w pewnym przedziale na osi liczb rzeczywistych, jest nazywany ciągłym. Na przykład zmienna losowa reprezentująca liczbę samochodów sprzedanych w danym salonie w ciągu jednego dnia byłaby dyskretna, podczas gdy zmienna losowa reprezentująca wagę osoby w kilogramach (lub funtach) byłaby ciągła.
Rozkład prawdopodobieństwa dla zmiennej losowej opisuje, jak rozkładają się prawdopodobieństwa na wartości zmiennej losowej. Dla dyskretnej zmiennej losowej x rozkład prawdopodobieństwa jest określony przez funkcję masy prawdopodobieństwa, oznaczoną przez f (x). Ta funkcja zapewnia prawdopodobieństwo dla każdej wartości zmiennej losowej. Przy opracowywaniu funkcji prawdopodobieństwa dla dyskretnej zmiennej losowej muszą być spełnione dwa warunki: (1) f (x) musi być nieujemne dla każdej wartości zmiennej losowej oraz (2) suma prawdopodobieństw dla każdej wartości zmienna losowa musi być równa jeden.
Ciągła zmienna losowa może przyjmować dowolną wartość w przedziale na osi liczby rzeczywistej lub w zbiorze przedziałów. Ponieważ istnieje nieskończona liczba wartości w każdym przedziale, nie ma sensu mówić o prawdopodobieństwie, że zmienna losowa przyjmie określoną wartość; zamiast tego rozważane jest prawdopodobieństwo, że ciągła zmienna losowa będzie leżeć w danym przedziale.
W przypadku ciągłym odpowiednikiem funkcji masy prawdopodobieństwa jest funkcja gęstości prawdopodobieństwa, również oznaczona przez f (x) . W przypadku ciągłej zmiennej losowej funkcja gęstości prawdopodobieństwa określa wysokość lub wartość funkcji przy dowolnej określonej wartości x; nie daje bezpośrednio prawdopodobieństwa, że zmienna losowa przybierze określoną wartość. Jednak obszar pod wykresem f (x) odpowiadający pewnemu przedziałowi, otrzymany przez obliczenie całki f (x) w tym przedziale, daje prawdopodobieństwo, że zmienna przyjmie wartość w tym przedziale. Funkcja gęstości prawdopodobieństwa musi spełniać dwa wymagania: (1) f (x) musi być nieujemna dla każdej wartości zmiennej losowej oraz (2) całka po wszystkich wartościach zmiennej losowej musi być równa jeden.
Oczekiwana wartość lub średnia zmiennej losowej – oznaczonej przez E (x) lub μ – jest średnią ważoną wartości, jakie może przyjąć zmienna losowa. W przypadku dyskretnym wagi są określone przez funkcję masy prawdopodobieństwa, aw przypadku ciągłym wagi są przez funkcję gęstości prawdopodobieństwa. Wzory do obliczania oczekiwanych wartości zmiennych losowych dyskretnych i ciągłych są podane odpowiednio w równaniach 2 i 3.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
Wariancja zmiennej losowej, oznaczona przez Var (x) lub σ2, jest średnią ważoną kwadratów odchyleń od średniej. W przypadku dyskretnym wagi są określone przez funkcję masy prawdopodobieństwa, aw przypadku ciągłym wagi są przez funkcję gęstości prawdopodobieństwa. Wzory do obliczania wariancji zmiennych losowych dyskretnych i ciągłych podano odpowiednio za pomocą równań 4 i 5. Odchylenie standardowe, oznaczone σ, jest dodatnim pierwiastkiem kwadratowym z wariancji. Ponieważ odchylenie standardowe jest mierzone w tych samych jednostkach co zmienna losowa, a wariancja jest mierzona w jednostkach kwadratowych, odchylenie standardowe jest często preferowaną miarą.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)