Estimation (Polski)

  • Wprowadzenie
  • Punktowe oszacowanie
  • Pożądane właściwości punktu Estymatory
  • Znaczenie próbkowania i projektowania
  • Błąd standardowy i wielkość próby
  • Kolejny estymator punktowy (odchylenie standardowe próbki)
  • Podsumowanie punktu Oszacowanie
  • Wprowadzenie do szacowania przedziałów
  • Podsumujmy
CO-4: Rozróżnij różne skale pomiaru , wybierz odpowiednie opisowe i wnioskowe metody statystyczne w oparciu o te rozróżnienia i zinterpretuj wyniki.
CO-6: Zastosuj podstawowe pojęcia dotyczące prawdopodobieństwa, zmienności losowej i powszechnie użył statystycznych rozkładów prawdopodobieństwa.
Wideo: Oszacowanie (11:40)

Wprowadzenie

We wprowadzeniu do wnioskowania zdefiniowane szacunki punktowe i inte szacunki rval.

  • W estymacji punktowej szacujemy nieznany parametr przy użyciu pojedynczej liczby obliczonej z danych próbki.
  • W przedziale estymacji, szacujemy nieznany parametr przy użyciu przedziału wartości, który prawdopodobnie zawiera prawdziwą wartość tego parametru (i określamy, na ile jesteśmy przekonani, że ten przedział rzeczywiście zawiera prawdziwą wartość parametru).

W tej sekcji wprowadzimy pojęcie przedziału ufności i nauczymy się obliczać przedziały ufności dla średnich populacji i proporcji populacji (po spełnieniu określonych warunków).

W części 4B zajmiemy się zobacz, że przedziały ufności są przydatne, gdy chcemy użyć danych do oszacowania nieznanego parametru populacji, nawet jeśli ten parametr jest szacowany przy użyciu wielu zmiennych (takich jak nasze przypadki: CC, CQ, QQ).

Na przykład , możemy skonstruować przedziały ufności dla nachylenia równania regresji lub współczynnika korelacji. Robiąc to, zawsze używamy naszych danych do oszacowania przedziału czasu dla nieznanego parametru populacji (TRUE slope lub TRUE współczynnik korelacji).

Point Estimation

EK 4.29: Określ i zastosuj prawidłowe oszacowania punktowe dla określonych parametrów populacji.

Estymacja punktowa to forma wnioskowania statystycznego, w której na podstawie przykładowych danych szacujemy nieznany parametr zainteresowania przy użyciu pojedynczej wartości (stąd oszacowanie punktu nazwy). Jak ilustrują poniższe dwa przykłady, ta forma wnioskowania jest dość intuicyjna.

PRZYKŁAD:

Załóżmy, że interesuje nas studiowanie poziomy IQ studentów Smart University (SU). W szczególności (ponieważ poziom IQ jest zmienną ilościową) interesuje nas oszacowanie µ (mu), średniego poziomu IQ wszystkich uczniów w SU.

Wybrano losową próbę 100 uczniów SU, a ich średni poziom IQ (próbka) wyniósł 115 (x-bar).

Gdybyśmy chcieli oszacować µ (mu), średni poziom IQ populacji, za pomocą pojedynczej liczby na podstawie próby , intuicyjnie sensowne byłoby użycie odpowiedniej wielkości w próbce, średniej z próby, która wynosi 115. Mówimy, że 115 jest oszacowaniem punktowym dla µ (mu) i ogólnie zawsze będziemy używać średniej z próbki (x -bar) jako estymator punktowy dla µ (mu). (Zwróć uwagę, że kiedy mówimy o określonej wartości (115), używamy terminu oszacowanie, a kiedy mówimy ogólnie o statystyce x-bar, używamy estymatora terminu. Poniższy rysunek podsumowuje ten przykład:

Oto kolejny przykład.

PRZYKŁAD:

Załóżmy, że interesują nas opinie dorosłych Amerykanów dotyczące legalizacji używania marihuany. W szczególności interesuje nas parametr p, proporcja Dorośli w Stanach Zjednoczonych, którzy uważają, że marihuana powinna zostać zalegalizowana.

Załóżmy, że ankieta przeprowadzona na 1000 dorosłych Amerykanów wykazała, że 560 z nich uważa, że marihuana powinna zostać zalegalizowana. Gdybyśmy chcieli oszacować p, proporcję populacji, używając jednej liczby na próbce intuicyjnie sensowne byłoby użycie odpowiedniej ilości w próbce, proporcja próbki p-hat = 560/1000 = 0,56. W tym przypadku mówimy, że 0,56 jest oszacowaniem punktowym dla p i generalnie l Zawsze używam p-hat jako estymatora punktowego dla p. (Zauważ, ponownie, że kiedy mówimy o określonej wartości (0,56), używamy terminu oszacowanie, a kiedy mówimy ogólnie o statystycznym p-hat, używamy estymatora terminu. Oto wizualne podsumowanie tego przykładu :

Czy Rozumiem ?: Szacowanie punktów

Pożądane właściwości estymatorów punktów

Możesz mieć wrażenie, że skoro jest tak intuicyjny, mógłbyś samodzielnie obliczyć szacowanie punktów, nawet bez korzyści z całego kursu statystyki.Z pewnością intuicja podpowiada nam, że najlepszym estymatorem średniej populacji (mu, µ) powinno być x-bar, a najlepszym estymatorem odsetka populacji p powinno być p-hat.

Teoria prawdopodobieństwa robi coś więcej; w rzeczywistości daje wyjaśnienie (poza intuicją), dlaczego x-bar i p-hat są dobrym wyborem jako estymatory punktowe odpowiednio dla µ (mu) i p. W sekcji Rozkłady próbkowania jednostki prawdopodobieństwa dowiedzieliśmy się o rozkładzie próbkowania x-bar i stwierdziliśmy, że dopóki próbka jest pobierana losowo, rozkład średnich z próby jest dokładnie wyśrodkowany na wartości średniej populacji.

Nasza statystyka, x-bar, jest zatem uważana za obiektywny estymator µ (mu). Każda konkretna średnia próby może okazać się mniejsza niż rzeczywista średnia populacji lub może okazać się większa. Ale na dłuższą metę takie średnie z próby są „założone”, ponieważ nie będą mniej lub bardziej zaniżać wartości niż przeszacowują.

Podobnie dowiedzieliśmy się, że rozkład próbkowania proporcji próbki, p -hat, jest wyśrodkowany na proporcji populacji p (o ile próbka jest pobierana losowo), dzięki czemu p-hat jest nieobciążonym estymatorem dla p.

Jak wspomniano we wstępie, teoria prawdopodobieństwa odgrywa kluczową rolę przy ustalaniu wyników wnioskowania statystycznego. Nasze stwierdzenie powyżej tej średniej próbki i próby proporcje są bezstronnymi estymatorami to pierwszy taki przypadek.

Znaczenie próbkowania i projektowania

Zwróć uwagę, jak ważne są zasady pobierania próbek i projektowania dla naszych powyższych wyników: jeśli próbka dorosłych Amerykanów w (przykład 2 na poprzedniej stronie) nie była przypadkowa, ale zamiast tego obejmowała głównie studentów, wtedy 0,56 byłoby nieobiektywnym oszacowaniem dla p, proporcje na wszystkich dorosłych w Stanach Zjednoczonych, którzy uważają, że marihuana powinna zostać zalegalizowana.

Jeśli projekt ankiety był wadliwy, na przykład przypominając o niebezpieczeństwach związanych z marihuaną prowadzących do twardych narkotyków lub przypomnieć o korzyściach marihuany dla pacjentów z rakiem, wtedy 0,56 byłoby odchylone odpowiednio po stronie niskiej lub wysokiej.

Nasze szacunki punktowe są naprawdę obiektywnymi szacunkami dla parametru populacji tylko wtedy, gdy próbka jest losowa, a projekt badania nie błędne.

Błąd standardowy i wielkość próby

Nie tylko średnia i proporcja próbki są zgodne z celem, o ile próbki są losowe, ale ich precyzja poprawia się wraz ze wzrostem wielkości próby.

Znowu istnieją dwie „warstwy” wyjaśniające to.

Intuicyjnie, większe rozmiary próbek dają nam więcej informacji, dzięki którym możemy określić prawdziwy charakter populacji. Możemy zatem oczekiwać, że średnia próby i proporcja próby otrzymane z większej próby będą bliższe odpowiednio średniej i proporcji populacji. W skrajnym przypadku, gdy próbkujemy całą populację (co nazywa się spisem ludności), średnia próby i proporcja próby będą dokładnie pokrywać się ze średnią populacji i proporcją populacji. Jest jeszcze jedna warstwa, która ponownie pochodzi z tego, o czym się dowiedzieliśmy rozkład próbkowania średniej próby i proporcji w próbce. Użyjmy średniej z próby do wyjaśnienia.

Przypomnijmy, że rozkład próby średniej próbki x-bar jest, jak wspomnieliśmy wcześniej, wyśrodkowany na średniej populacji µ (mu) i ma błąd standardowy (odchylenie standardowe statistic, x-bar) z

W rezultacie jako rozmiar próbki n wzrasta, rozkład próbkowania x-bar jest mniej rozłożony. Oznacza to, że wartości x-bar oparte na większej próbce z większym prawdopodobieństwem będą bliższe µ (mu) (jak pokazano na poniższym rysunku):

Podobnie, ponieważ rozkład próbkowania p-hat jest wyśrodkowany na p i ma

, które maleje wraz ze wzrostem rozmiaru próbki, wartości p-hat są bardziej prawdopodobne, że będą bliższe p, gdy rozmiar próbki jest większy.

Kolejny estymator punktów

Innym przykładem estymatora punktów jest przykładowe odchylenie standardowe,

do oszacowania odchylenia standardowego populacji, σ (sigma).

W tym kursie nie będziemy zajmować się szacowaniem standardu populacji odchylenie ze względu na to samo, ale ponieważ często zastępujemy odchylenie standardowe próbki σ (sigma) podczas standaryzacji średniej próbki, warto zauważyć, że s jest unbia estymator sed dla σ (sigma).

Gdybyśmy w naszym estymatorze odchylenia standardowego populacji podzielili przez n zamiast n – 1, to na dłuższą metę nasza wariancja próby byłaby winna niewielkiego niedoszacowania.Dzielenie przez n – 1 realizuje cel, jakim jest uczynienie tego estymatora punktowego bezstronnym.

Powodem, dla którego nasza formuła na s, wprowadzona w jednostce Exploratory Data Analysis, obejmuje dzielenie przez n – 1 zamiast przez n, jest fakt, że w praktyce chcemy używać nieobciążonych estymatorów.

Podsumujmy

  • Używamy p-hat (proporcja próby) jako estymatora punktowego dla p (proporcji populacji). Jest to nieobciążony estymator: jego długookresowy rozkład jest wyśrodkowany na p, o ile próbka jest losowa.
  • Używamy x-bar (średnia próbki) jako estymatora punktowego dla µ (mu, średnia populacji). Jest to nieobciążony estymator: jego długookresowy rozkład jest wyśrodkowany w µ (mu), o ile próbka jest losowa.
  • W obu przypadkach im większy rozmiar próbki, im dokładniejszy estymator punktowy. Innymi słowy, im większa wielkość próby, tym większe prawdopodobieństwo, że średnia (proporcja) próby jest zbliżona do średniej (proporcji) nieznanej populacji.
Czy to dostałem?: Właściwości estymatorów punktów

Estymacja przedziałowa

Oszacowanie punktów jest proste i intuicyjne, ale także nieco problematyczne. Oto dlaczego:

Kiedy szacujemy μ (mu) na podstawie średniej próbki x-bar, prawie na pewno popełnimy jakiś błąd. Chociaż wiemy, że wartości x-bar wynoszą około μ (mu), jest bardzo mało prawdopodobne, że wartość x-bar spadnie dokładnie o μ (mu).

Biorąc pod uwagę, że takie błędy są fakt życia dla oszacowań punktowych (przez sam fakt, że opieramy nasze oszacowanie na jednej próbie, która stanowi niewielki ułamek populacji), szacunki te same w sobie mają ograniczoną użyteczność, chyba że jesteśmy w stanie określić ilościowo zakres błąd oszacowania. Szacowanie przedziałowe rozwiązuje ten problem. Ideą estymacji przedziałowej jest zatem ulepszenie prostych oszacowań punktowych poprzez dostarczenie informacji o wielkości załączonego błędu.

W tym wprowadzeniu podamy przykłady, które dadzą solidną intuicję na temat podstawowa idea estymacji przedziału.

PRZYKŁAD:

Rozważmy przykład, który omówiliśmy w sekcji szacowania punktowego:

Załóżmy, że jesteśmy zainteresowani badaniem poziomu IQ studentów uczęszczających na Smart University (SU). W szczególności (ponieważ poziom IQ jest zmienną ilościową) interesuje nas oszacowanie μ (mu), średniego poziomu IQ wszystkich uczniów SU. Wybrano losową próbę 100 uczniów SU, a ich średni poziom IQ (próbka) wyniósł 115 (x-bar).

W estymacji punktowej użyliśmy x-bar = 115 jako oszacowania punktowego dla μ (mu). Jednak nie mieliśmy pojęcia, jaki może być błąd oszacowania związany z takim oszacowaniem. Estymacja przedziałowa idzie o krok dalej i mówi mniej więcej tak:

„Jestem w 95% przekonany, że używając estymatora punktowego x-bar = 115 do oszacowania μ (mu), nie tracę nic więcej niż 3 punkty IQ. Innymi słowy, mam 95% pewności, że μ (mu) mieści się w przedziale od 3 do 115 lub między 112 (115 – 3) a 118 (115 + 3).

Jednak Innym sposobem na powiedzenie tego samego jest: jestem w 95% przekonany, że μ (mu) jest gdzieś w przedziale (112,118) (lub jest przez niego pokryty). (Komentarz: W tym momencie nie powinieneś się martwić ani próbować rozgryźć , jak otrzymaliśmy te liczby. Zrobimy to później. Wszystko, co chcemy tutaj zrobić, to upewnić się, że rozumiesz pomysł.)

Zauważ, że podczas gdy oszacowanie punktowe dostarczyło tylko jedną liczbę jako oszacowanie dla μ (mu) 115, estymacja przedziału zapewnia cały przedział „wiarygodnych wartości” dla μ (mu) (między 112 a 118), a także dołącza poziom naszej pewności, że ten przedział rzeczywiście zawiera wartość μ (mu) do nasze oszacowanie (w naszym przykładzie 95% pewność). Dlatego przedział (112,118) nazywany jest „95% przedziałem ufności dla μ (mu)”.

Spójrzmy na inny przykład:

PRZYKŁAD:

Rozważmy drugi przykład z sekcji szacowania punktów.

Załóżmy, że interesują nas opinie dorosłych Amerykanów dotyczące legalizacji używania marihuana. W szczególności interesuje nas parametr p, odsetek dorosłych Amerykanów, którzy uważają, że marihuana powinna być zalegalizowana.

Załóżmy, że ankieta przeprowadzona wśród 1000 dorosłych Amerykanów wykazała, że 560 z nich uważa, że marihuana powinna zostać zalegalizowana.

Gdybyśmy chcieli oszacować p, proporcję populacji, pojedynczą liczbą na podstawie próbki intuicyjnie sensowne byłoby użycie odpowiedniej ilości w próbce, proporcji próbki p-hat = 560/1000 = 0,56.

Estymacja interwałowa posunęłaby się o krok dalej i coś powie na przykład:

„Mam 90% pewność, że używając 0,56 do oszacowania prawdziwego odsetka ludności, p, odchodzę o (lub mam błąd) nie więcej niż 0,03 (lub 3 punkty procentowe). Innymi słowy, mam 90% pewności, że rzeczywista wartość p jest gdzieś pomiędzy 0.53 (0,56 – 0,03) i 0,59 (0,56 + 0,03). ”

Jeszcze inny sposób powiedzenia tego brzmi:„ Mam 90% pewności, że p mieści się w przedziale (0,53, 0,59) ”.

W tym przykładzie (0,53; 0,59) to 90% przedział ufności dla p.

Podsumujmy

Dwa przykłady pokazały nam że idea estymacji przedziału polega na tym, że zamiast podawać tylko jedną liczbę do oszacowania nieznanego parametru będącego przedmiotem zainteresowania, należy zapewnić przedział wiarygodnych wartości parametru oraz poziom pewności, że wartość parametru jest objęta tym przedziałem.

Teraz zajmiemy się bardziej szczegółowo i dowiemy się, jak te przedziały ufności są tworzone i interpretowane w kontekście. Jak zobaczysz, pomysły, które zostały opracowane w sekcji „Rozkłady próbkowania” jednostki prawdopodobieństwa będzie znowu bardzo ważna. Przypomnijmy, że w przypadku szacowania punktowego nasze zrozumienie rozkładów próbkowania prowadzi do weryfikacji, że nasze statystyki są bezstronne i daje nam dokładne wzory na błąd standardowy naszych statystyk.

Zaczniemy od omówienia przedziałów ufności dla średnia populacji μ (mu), a następnie omówienie przedziałów ufności dla proporcji populacji p.

Oznaczone jako: CO-4, Estymator, Estymator, Interval Estimate, LO 4,29, Parameter, Point Estimate, Estymator punktów, wielkość próby, próbkowanie, dystrybucja prób, błąd standardowy statystyki, statystyki, projekt badania, obiektywizm

Leave a Reply

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *