무작위 변수는 통계 실험 결과에 대한 숫자 설명입니다. 유한 한 수 또는 무한한 일련의 값만을 가정 할 수있는 랜덤 변수는 이산 적이라고합니다. 실수 라인에서 일정 간격의 값을 가정 할 수있는 것은 연속적이라고합니다. 예를 들어, 특정 대리점에서 하루에 판매 된 자동차 수를 나타내는 랜덤 변수는 이산적인 반면 사람의 무게를 킬로그램 (또는 파운드)으로 나타내는 랜덤 변수는 연속적입니다.
확률 변수에 대한 확률 분포는 확률이 확률 변수 값에 분포되는 방식을 설명합니다. 이산 확률 변수 x의 경우 확률 분포는 f (x)로 표시되는 확률 질량 함수로 정의됩니다. 이 함수는 확률 변수의 각 값에 대한 확률을 제공합니다. 이산 확률 변수에 대한 확률 함수를 개발할 때 두 가지 조건이 충족되어야합니다. (1) f (x)는 확률 변수의 각 값에 대해 음이 아니어야하며 (2) 각 값에 대한 확률의 합입니다. 랜덤 변수는 1과 같아야합니다.
연속 랜덤 변수는 실수 라인의 간격 또는 간격 모음의 값을 가정 할 수 있습니다. 임의의 간격에는 무한한 수의 값이 있으므로 임의 변수가 특정 값을 취할 확률에 대해 이야기하는 것은 의미가 없습니다. 대신 연속 랜덤 변수가 주어진 간격 내에있을 확률이 고려됩니다.
연속의 경우 확률 질량 함수의 대응 요소는 확률 밀도 함수이며 f (x)로도 표시됩니다. . 연속 랜덤 변수의 경우 확률 밀도 함수는 x의 특정 값에서 함수의 높이 또는 값을 제공합니다. 랜덤 변수가 특정 값을 취할 확률을 직접 제공하지 않습니다. 그러나 해당 구간에 대한 f (x)의 적분을 계산하여 얻은 일부 구간에 해당하는 f (x) 그래프 아래의 영역은 변수가 해당 구간 내의 값을 가질 확률을 제공합니다. 확률 밀도 함수는 두 가지 요구 사항을 충족해야합니다. (1) f (x)는 랜덤 변수의 각 값에 대해 음이 아니어야하며 (2) 랜덤 변수의 모든 값에 대한 적분은 1과 같아야합니다.
E (x) 또는 μ로 표시된 확률 변수의 예상 값 또는 평균은 확률 변수가 가정 할 수있는 값의 가중 평균입니다. 불연속적인 경우 가중치는 확률 질량 함수로 제공되고 연속적인 경우 가중치는 확률 밀도 함수로 제공됩니다. 이산 및 연속 랜덤 변수의 기대 값을 계산하는 공식은 각각 방정식 2와 3으로 제공됩니다.
E (x) = Σxf (x) (2)
E (x) = ∫xf (x) dx (3)
Var (x) 또는 σ2로 표시되는 랜덤 변수의 분산은 평균에서 제곱 된 편차의 가중 평균입니다. 불연속적인 경우 가중치는 확률 질량 함수로 제공되고 연속적인 경우 가중치는 확률 밀도 함수로 제공됩니다. 이산 및 연속 랜덤 변수의 분산을 계산하는 공식은 각각 방정식 4와 5로 제공됩니다. σ로 표시되는 표준 편차는 분산의 양의 제곱근입니다. 표준 편차는 랜덤 변수와 동일한 단위로 측정되고 분산은 제곱 단위로 측정되기 때문에 표준 편차가 종종 선호되는 측정 값입니다.
Var (x) = σ2 = Σ (x − μ) 2f (x) (4)
Var (x) = σ2 = ∫ (x − μ) 2f (x) dx (5)