Eine Zufallsvariable ist eine numerische Beschreibung des Ergebnisses eines statistischen Experiments. Eine Zufallsvariable, die nur eine endliche Zahl oder eine unendliche Folge von Werten annehmen kann, wird als diskret bezeichnet. Eine, die in einem bestimmten Intervall auf der reellen Zahlenlinie einen beliebigen Wert annehmen kann, wird als stetig bezeichnet. Beispielsweise wäre eine Zufallsvariable, die die Anzahl der an einem Tag bei einem bestimmten Händler verkauften Autos darstellt, diskret, während eine Zufallsvariable, die das Gewicht einer Person in Kilogramm (oder Pfund) darstellt, kontinuierlich ist.
Die Wahrscheinlichkeitsverteilung für eine Zufallsvariable beschreibt, wie die Wahrscheinlichkeiten über die Werte der Zufallsvariablen verteilt sind. Für eine diskrete Zufallsvariable x wird die Wahrscheinlichkeitsverteilung durch eine Wahrscheinlichkeitsmassenfunktion definiert, die mit f (x) bezeichnet wird. Diese Funktion liefert die Wahrscheinlichkeit für jeden Wert der Zufallsvariablen. Bei der Entwicklung der Wahrscheinlichkeitsfunktion für eine diskrete Zufallsvariable müssen zwei Bedingungen erfüllt sein: (1) f (x) muss für jeden Wert der Zufallsvariablen nicht negativ sein und (2) die Summe der Wahrscheinlichkeiten für jeden Wert von Die Zufallsvariable muss gleich eins sein.
Eine kontinuierliche Zufallsvariable kann einen beliebigen Wert in einem Intervall auf der reellen Zahlenlinie oder in einer Sammlung von Intervallen annehmen. Da es in jedem Intervall unendlich viele Werte gibt, ist es nicht sinnvoll, über die Wahrscheinlichkeit zu sprechen, dass die Zufallsvariable einen bestimmten Wert annimmt. Stattdessen wird die Wahrscheinlichkeit berücksichtigt, dass eine kontinuierliche Zufallsvariable innerhalb eines bestimmten Intervalls liegt.
Im kontinuierlichen Fall ist das Gegenstück der Wahrscheinlichkeitsmassenfunktion die Wahrscheinlichkeitsdichtefunktion, die auch mit f (x) bezeichnet wird. . Für eine kontinuierliche Zufallsvariable liefert die Wahrscheinlichkeitsdichtefunktion die Höhe oder den Wert der Funktion bei einem bestimmten Wert von x; Es gibt nicht direkt die Wahrscheinlichkeit an, dass die Zufallsvariable einen bestimmten Wert annimmt. Die Fläche unter dem Graphen von f (x), die einem bestimmten Intervall entspricht und durch Berechnen des Integrals von f (x) über dieses Intervall erhalten wird, liefert jedoch die Wahrscheinlichkeit, dass die Variable innerhalb dieses Intervalls einen Wert annimmt. Eine Wahrscheinlichkeitsdichtefunktion muss zwei Anforderungen erfüllen: (1) f (x) muss für jeden Wert der Zufallsvariablen nicht negativ sein, und (2) das Integral über alle Werte der Zufallsvariablen muss gleich eins sein.
Der erwartete Wert oder Mittelwert einer Zufallsvariablen – bezeichnet mit E (x) oder μ – ist ein gewichteter Durchschnitt der Werte, die die Zufallsvariable annehmen kann. Im diskreten Fall sind die Gewichte durch die Wahrscheinlichkeitsmassenfunktion gegeben, und im kontinuierlichen Fall sind die Gewichte durch die Wahrscheinlichkeitsdichtefunktion gegeben. Die Formeln zum Berechnen der erwarteten Werte von diskreten und kontinuierlichen Zufallsvariablen sind durch die Gleichungen 2 bzw. 3 gegeben.
E (x) = Σxf (x) (2)
E. (x) = ∫xf (x) dx (3)
Die Varianz einer Zufallsvariablen, bezeichnet mit Var (x) oder σ2, ist ein gewichteter Durchschnitt der quadratischen Abweichungen vom Mittelwert. Im diskreten Fall sind die Gewichte durch die Wahrscheinlichkeitsmassenfunktion gegeben, und im kontinuierlichen Fall sind die Gewichte durch die Wahrscheinlichkeitsdichtefunktion gegeben. Die Formeln zur Berechnung der Varianzen diskreter und kontinuierlicher Zufallsvariablen sind durch die Gleichungen 4 bzw. 5 gegeben. Die mit σ bezeichnete Standardabweichung ist die positive Quadratwurzel der Varianz. Da die Standardabweichung in denselben Einheiten wie die Zufallsvariable und die Varianz in quadratischen Einheiten gemessen wird, ist die Standardabweichung häufig das bevorzugte Maß.
Var (x) = σ2 = Σ (x – μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x – μ) 2f (x) dx (5)