- 소개
- 포인트 추정
- 원하는 포인트 속성 추정기
- 샘플링 및 설계의 중요성
- 표준 오차 및 샘플 크기
- 다른 포인트 추정기 (샘플 표준 편차)
- 포인트 요약 추정
- 간격 추정 소개
- 요약하자
소개
추론 소개에서는 정의 된 포인트 추정 및 정수 rval 추정.
- 포인트 추정에서는 샘플 데이터에서 계산 된 단일 숫자를 사용하여 알려지지 않은 매개 변수를 추정합니다.
- 간격 우리는 해당 매개 변수의 실제 값을 포함 할 가능성이있는 값의 간격을 사용하여 알려지지 않은 매개 변수를 추정합니다 (그리고이 간격이 실제로 매개 변수의 실제 값을 캡처한다는 확신을 나타냄).
이 섹션에서는 신뢰 구간의 개념을 소개하고 모집단 평균 및 모집단 비율 (특정 조건이 충족 될 때)에 대한 신뢰 구간을 계산하는 방법을 배웁니다.
4B 단원에서는 이 매개 변수가 여러 변수 (예 : CC, CQ, QQ)를 사용하여 추정되는 경우에도 데이터를 사용하여 알려지지 않은 모집단 매개 변수를 추정 할 때마다 신뢰 구간이 유용합니다.
예 : , 회귀 방정식의 기울기 또는 상관 계수에 대한 신뢰 구간을 구성 할 수 있습니다. 이를 위해 항상 데이터를 사용하여 알려지지 않은 모집단 매개 변수 (TRUE 기울기 또는 TRUE 상관 계수)에 대한 간격 추정치를 제공합니다.
포인트 추정
포인트 추정은 샘플 데이터를 기반으로 알려지지 않은 매개 변수를 추정하는 통계적 추론의 형태입니다. 단일 값을 사용하여 관심이 있습니다 (따라서 이름 포인트 추정). 다음 두 가지 예에서 알 수 있듯이 이러한 형태의 추론은 매우 직관적입니다.
예 :
연구에 관심이 있다고 가정 해 보겠습니다. Smart University (SU) 학생들의 IQ 수준. 특히 (IQ 수준은 양적 변수이기 때문에) SU에있는 모든 학생들의 평균 IQ 수준 인 μ (mu)를 추정하는 데 관심이 있습니다.
100 명의 SU 학생을 무작위로 선택했습니다. 그리고 그들의 (샘플) 평균 IQ 수준은 115 (x-bar) 인 것으로 밝혀졌습니다.
μ (mu)를 추정하려는 경우 모집단은 샘플을 기반으로 한 단일 숫자로 IQ 수준을 의미합니다. , 샘플에서 해당 수량, 즉 115 인 샘플 평균을 사용하는 것이 직관적으로 이해가 될 것입니다. 115가 µ (mu)에 대한 포인트 추정치라고 말하고 일반적으로 항상 샘플 평균 (x)을 사용합니다. -bar)를 µ (mu)에 대한 포인트 추정량으로 사용합니다. (특정 값 (115)에 대해 말할 때는 추정값이라는 용어를 사용하고, 통계적 x-bar에 대해 일반적으로 말할 때는 추정값이라는 용어를 사용합니다. 다음 그림은이 예를 요약 한 것입니다.
다음은 또 다른 예입니다.
예 :
마리화나 사용 합법화에 대한 미국 성인의 의견에 관심이 있다고 가정 해 보겠습니다. 특히 대마초의 비율 인 매개 변수 p에 관심이 있습니다. 마리화나를 합법화해야한다고 믿는 미국 성인.
미국 성인 1,000 명을 대상으로 한 설문 조사에서 560 명이 마리화나를 합법화해야한다고 생각한다고 가정 해 보겠습니다. p를 추정하려면 단일 숫자를 기반으로 한 인구 비율 표본에서 표본 비율 p-hat = 560/1000 = 0.56을 사용하는 것이 직관적으로 이해할 수 있습니다.이 경우 0.56이 p에 대한 점 추정치라고 말하고 일반적으로 우리는 ‘엘 l 항상 p-hat을 p에 대한 포인트 추정기로 사용합니다. (다시 말하지만, 특정 값 (0.56)에 대해 이야기 할 때는 추정값이라는 용어를 사용하고 통계적 p-hat에 대해 일반적으로 말할 때는 추정값이라는 용어를 사용합니다. 다음은이 예의 시각적 요약입니다. :
포인트 추정기의 원하는 속성
당신은 그것이 매우 직관적이기 때문에 당신은 자신이 포인트 추정을 알아낼 수 있었을 것입니다. 통계에서 전체 과정의 이점.확실히 우리의 직관에 따르면 모집단 평균 (mu, µ)에 대한 최상의 추정치는 x-bar 여야하고 모집단 비율 p에 대한 최상의 추정치는 p-hat이어야합니다.
확률 이론은이 이상의 역할을합니다. 실제로 x-bar와 p-hat이 각각 µ (mu) 및 p에 대한 포인트 추정기로 좋은 선택 인 이유를 (직관 이상으로) 설명합니다. 확률 단위의 표본 분포 섹션에서 x-bar의 표본 분포에 대해 배웠고 표본을 무작위로 추출하는 한 표본 평균의 분포가 모집단 평균 값에 정확히 중심에 있음을 발견했습니다.
따라서 우리의 통계 x-bar는 µ에 대한 편향되지 않은 추정량이라고합니다. (뮤). 특정 표본 평균은 실제 모집단 평균보다 작을 수도 있고 더 많을 수도 있습니다. 그러나 장기적으로 이러한 표본 평균은 과대 평가하는 것보다 더 많거나 적은 빈도로 과소 평가하지 않는다는 점에서 “목표”에 있습니다.
마찬가지로 표본 비율의 표본 분포 p -hat은 모집단 비율 p의 중심에 위치하므로 (샘플이 무작위로 추출되는 한) p-hat을 p에 대한 편향되지 않은 추정치로 만듭니다.
소개에서 언급했듯이 확률 이론은 통계적 추론에 대한 결과를 설정하는 데 필수적인 역할을합니다. 샘플 평균 및 샘플 위에 대한 우리의 주장 비율은 편향되지 않은 추정치입니다.
샘플링 및 디자인의 중요성
샘플링 및 디자인의 원칙이 위의 결과에 얼마나 중요한지 주목하십시오. in (이전 페이지의 예 2)은 무작위가 아니었지만 주로 대학생이 포함 된 경우 0.56은 p에 대한 편향된 추정치가 될 것입니다. 마리화나가 합법화되어야한다고 생각하는 모든 미국 성인에 대해 설명합니다.
해독 약물로 이어지는 마리화나의 위험성에 대한 알림 또는 혜택에 대한 알림이 포함 된 질문을로드하는 등 설문 조사 디자인에 결함이있는 경우 암 환자의 경우 0.56은 각각 낮은 쪽 또는 높은쪽에 편향되어 있습니다.
표준 오차 및 표본 크기
표본이 무작위이면 표본 평균과 표본 비율이 목표에있을뿐만 아니라 표본 크기가 증가하면 정밀도가 향상됩니다.
다시 여기에는이를 설명하기위한 두 개의 “레이어”가 있습니다.
앞에서 언급했듯이 표본 평균 x-bar의 표본 분포는 모집단 평균 µ (mu) 중심에 있고 표준 오차 (표준 편차)가 있습니다. 통계, x-bar) /
결과적으로 샘플 크기 n이 증가하면 x-bar의 샘플링 분포가 덜 퍼집니다. 이는 더 큰 샘플을 기반으로하는 x-bar의 값이 µ (mu)에 더 가깝다는 것을 의미합니다 (아래 그림 참조).
유사하게 p-hat의 샘플링 분포가 p를 중심으로하고
샘플 크기가 클수록 감소하고, 샘플 크기가 클수록 p-hat 값이 p에 가까울 가능성이 높습니다.
다른 포인트 추정기
포인트 추정기의 또 다른 예는 표본 표준 편차를 사용하는 것입니다.
인구 표준 편차 σ (시그마)를 추정합니다.
이 과정에서는 인구 표준을 추정하는 데 관심이 없습니다. 그 자체를 위해 편차가 있지만, 표본 평균을 표준화 할 때 σ (시그마) 대신 표본 표준 편차 (s)를 종종 대체 할 것이기 때문에 s는 편향되지 않음을 지적 할 가치가 있습니다. σ (시그마)에 대한 sed 추정량.
모집단 표준 편차 추정기에서 n – 1 대신 n으로 나눈 경우 장기적으로 표본 분산은 약간의 과소 추정의 원인이됩니다.n – 1로 나누는 것은이 점 추정기를 편향되지 않게 만드는 목표를 달성합니다.
탐색 데이터 분석 단위에 도입 된 s에 대한 공식이 n 대신 n – 1로 나누는 이유는 다음과 같습니다. 실제로는 편향되지 않은 추정값을 사용하고 싶습니다.
요약하자
- p (인구 비율)에 대한 포인트 추정값으로 p-hat (표본 비율)을 사용합니다. 편향되지 않은 추정기입니다. 장기 분포는 표본이 무작위 인 한 p를 중심으로합니다.
- 점 추정기로 x-bar (표본 평균)를 사용합니다. µ (mu, 모집단 평균)의 경우. 편향되지 않은 추정기입니다. 샘플이 랜덤 인 한 장기 분포는 µ (mu)에 집중됩니다.
- 두 경우 모두 샘플 크기가 클수록 포인트 추정기가 더 정확합니다. 즉, 표본 크기가 클수록 표본 평균 (비율)이 알 수없는 모집단 평균 (비율)에 가까울 가능성이 높습니다.
간격 추정
포인트 추정은 간단하고 직관적이지만 약간 문제가 있습니다. 그 이유는 다음과 같습니다.
샘플 평균 x-bar로 μ (mu)를 추정 할 때 어떤 종류의 오류가 발생하는 것이 거의 보장됩니다. x-bar의 값이 μ (mu) 주위에 있다는 것을 알고 있지만 x-bar의 값이 정확히 μ (mu)로 떨어질 가능성은 거의 없습니다.
이러한 오류는 포인트 추정치에 대한 사실 (우리가 인구의 작은 부분 인 하나의 샘플에 대한 추정치를 기반으로한다는 사실에 의함), 이러한 추정치는 그 자체로 제한적 유용성입니다. 추정 오류. 간격 추정은이 문제를 해결합니다. 따라서 간격 추정의 기본 개념은 첨부 된 오류의 크기에 대한 정보를 제공하여 간단한 포인트 추정을 향상시키는 것입니다.
이 소개에서는 다음에 대한 확실한 직관을 제공하는 예를 제공합니다. 간격 추정의 기본 아이디어입니다.
예 :
점 추정 섹션에서 논의한 예를 고려하세요.
스마트 대학교 (SU)에 다니는 학생들의 IQ 수준을 연구하는 데 관심이 있다고 가정 해 보겠습니다. 특히 (IQ 수준은 양적 변수이기 때문에) SU에있는 모든 학생들의 평균 IQ 수준 인 μ (mu)를 추정하는 데 관심이 있습니다. 100 명의 SU 학생으로 구성된 무작위 샘플이 선택되었으며, 그들의 (샘플) 평균 IQ 수준은 115 (x-bar) 인 것으로 나타났습니다.
점 추정에서 μ (mu)에 대한 점 추정치로 x-bar = 115를 사용했습니다. 그러나 우리는 그러한 추정과 관련된 추정 오류가 무엇인지 알지 못했습니다. 간격 추정은 한 단계 더 나아가 점 추정을 수행하며 다음과 같이 말합니다.
“나는 점 추정 x-bar = 115를 사용하여 μ (mu)를 추정함으로써 더 이상 벗어나지 않는다고 95 % 확신합니다. 즉, μ (mu)가 115의 3 이내 또는 112 (115 – 3)와 118 (115 + 3) 사이에 있다고 95 % 확신합니다.”
아직 같은 것을 말하는 또 다른 방법은 : μ (mu)가 구간 (112,118)의 어딘가 (또는 그에 포함)에 있다고 95 % 확신합니다. (댓글 :이 시점에서 걱정하지 않거나 알아 내려고 노력하지 마십시오. ,이 숫자를 구한 방법입니다. 나중에 할 것입니다. 여기서하고 싶은 것은 아이디어를 이해하는 것입니다.)
점 추정에서는 μ에 대한 추정치로 하나의 숫자 만 제공했습니다. (mu) 115, 간격 추정은 μ (mu) (112와 118 사이)에 대해 “그럴듯한 값”의 전체 간격을 제공하며,이 간격에 실제로 μ (mu) 값이 포함된다는 신뢰 수준을 다음과 같이 연결합니다. 추정치 (이 예에서는 95 % 신뢰도). 따라서 구간 (112,118)을 “μ (mu)에 대한 95 % 신뢰 구간”이라고합니다.
다른 예를 살펴 보겠습니다.
예 :
포인트 추정 섹션의 두 번째 예를 고려해 보겠습니다.
우리가 미국 성인의 사용 합법화에 대한 의견에 관심이 있다고 가정 해 보겠습니다. 특히 마리화나가 합법화되어야한다고 믿는 미국 성인의 비율 인 매개 변수 p에 관심이 있습니다.
미국 성인 1,000 명을 대상으로 한 설문 조사에서 560 명이 마리화나를 합법화해야한다고 생각한다고 가정 해 보겠습니다.
p, 인구 비율을 단일 숫자로 추정하려는 경우 샘플을 기반으로 한 경우 샘플에서 해당 수량을 사용하는 것이 직관적으로 이해 될 수 있습니다. 샘플 비율 p-hat = 560 / 1000 = 0.56.
간격 추정은이를 한 단계 더 나아가서 무언가를 말할 것입니다. 좋아요 :
“저는 실제 모집단 비율 p를 추정하기 위해 0.56, 0.03 (또는 3 % 포인트) 이하로 벗어납니다 (또는 오류가 있습니다). 즉, p의 실제 값이 0 사이에 있다고 90 % 확신합니다.53 (0.56 – 0.03) 및 0.59 (0.56 + 0.03).”
또 다른 표현은 “p가 구간 (0.53, 0.59)에 포함된다고 90 % 확신합니다.”
이 예에서 (0.53, 0.59)는 p에 대한 90 % 신뢰 구간입니다.
요약 해 보겠습니다
두 예는 간격 추정의이면에있는 아이디어는 관심있는 알려지지 않은 매개 변수를 추정하기 위해 하나의 숫자 만 제공하는 대신 매개 변수의 그럴듯한 값의 간격과 매개 변수 값이이 간격에 포함된다는 신뢰 수준을 제공하는 것입니다.
이제 더 자세히 살펴보고 이러한 신뢰 구간이 컨텍스트에서 생성되고 해석되는 방법에 대해 알아볼 것입니다. 보시다시피 확률 단위의 “표본 분포”섹션에서 개발 된 아이디어는 다시 한 번 매우 중요합니다. 점 추정의 경우 표본 분포에 대한 이해는 통계가 편향되지 않았는지 확인하고 통계의 표준 오차에 대한 정확한 공식을 제공합니다.
우리는 먼저 신뢰 구간에 대해 논의 할 것입니다. 모집단 평균 μ (mu), 이후 모집단 비율 p에 대한 신뢰 구간에 대해 논의합니다.
태그 : CO-4, 추정치, 추정량, 구간 추정치, LO 4.29, 매개 변수, 포인트 추정치, 포인트 추정기, 표본 크기, 표본 추출, 표본 분포, 통계의 표준 오차, 통계, 연구 설계, 편향되지 않음