Becslés

  • Bevezetés
  • Pontbecslés
  • A pont kívánt tulajdonságai Becslők
  • A mintavétel és a tervezés fontossága
  • Standard hiba és a minta mérete
  • Egy másik pontbecslő (minta szórása)
  • A pont összefoglalása Becslés
  • Bevezetés az intervallum becslésbe
  • Összefoglaljuk
CO-4: Különbség a különböző mérési skálák között , e megkülönböztetések alapján válassza ki a megfelelő leíró és következtetési statisztikai módszereket, és értelmezze az eredményeket.
CO-6: A valószínűség, a véletlenszerű variáció és az statisztikai valószínűségi eloszlásokat használt.
Videó: Becslés (11:40)

Bevezetés

Bevezetésünkben a következtetéshez meghatározott pontbecslések és inte rval becslések.

  • Pontbecslésben egy ismeretlen paramétert becsülünk egyetlen szám felhasználásával, amelyet a minta adatai alapján számolunk.
  • Intervallumban becsléskor egy ismeretlen paramétert becsülünk meg egy olyan intervallum felhasználásával, amely valószínűleg tartalmazza a paraméter valódi értékét (és állítsuk be, mennyire magabiztosak vagyunk abban, hogy ez az intervallum valóban rögzíti a paraméter valódi értékét).

Ebben a részben bemutatjuk a konfidencia intervallum fogalmát, és megtanuljuk kiszámítani a konfidencia intervallumokat a populáció átlagához és a populáció arányához (ha bizonyos feltételek teljesülnek).

A 4B egységben a lásd, hogy a konfidencia intervallumok akkor hasznosak, amikor adatokat akarunk használni egy ismeretlen populációs paraméter becsléséhez, még akkor is, ha ezt a paramétert több változó (például eseteink: CC, CQ, QQ) használatával becsüljük meg.

Például , konfidencia intervallumokat készíthetünk a regressziós egyenlet meredekségéhez vagy a korrelációs együtthatóhoz. Ennek során mindig felhasználjuk adatainkat egy ismeretlen populációs paraméter (TRUE meredekség vagy TRUE korrelációs együttható) intervallumbecsléséhez.

Pontbecslés

LO 4.29: Határozza meg és használja a helyes pontbecslést a meghatározott populációs paraméterekhez.

A pontbecslés a statisztikai következtetés egyik formája, amelyben a minta adatai alapján becsüljük meg az ismeretlen paramétert érdekes egyetlen érték felhasználásával (ezért a névpont becslése). Amint azt a következő két példa szemlélteti, a következtetésnek ez a formája meglehetősen intuitív.

PÉLDA:

Tegyük fel, hogy érdekeltek vagyunk a tanulmányozásban a Smart University (SU) hallgatóinak IQ szintje. Különösen (mivel az IQ szint kvantitatív változó) vagyunk érdekeltek, hogy megbecsüljük az µ (mu) értéket, az összes SU-ban tanuló diák átlagos IQ-szintjét.

100 SU-s diákból véletlenszerű mintát választottunk, és a (minta) átlagos IQ szintjük 115 (x-bar) volt.

Ha a minta alapján egyetlen számmal akartuk megbecsülni a μ (mu) értéket, akkor a populáció átlag IQ szintjét. , intuitív értelme lenne a megfelelő mennyiséget használni a mintában, a minta átlagát, amely 115. Azt mondjuk, hogy 115 a µ (mu) pontbecslése, és általában mindig a minta átlagát (x -bar) mint µ (mu) pontbecslője. (Vegye figyelembe, hogy amikor a konkrét értékről (115) beszélünk, akkor a becslés kifejezést használjuk, és amikor általában az x-oszlop statisztikájáról beszélünk, akkor a becslő kifejezést használjuk. A következő ábra ezt a példát foglalja össze:

Itt van egy másik példa.

PÉLDA:

Tegyük fel, hogy érdekelnek az amerikai felnőttek véleménye a marihuána használatának legalizálásáról. Különösen a p paraméter, a Amerikai felnőttek, akik úgy gondolják, hogy a marihuánát legalizálni kell.

Tegyük fel, hogy egy 1000 amerikai felnőtt közvélemény-kutatása szerint 560-an úgy vélik, hogy a marihuánát legalizálni kell. Ha p-t szeretnénk megbecsülni, a népesség arányát egyetlen szám alapján a mintán intuitív értelme lenne a megfelelő mennyiséget használni a mintában, a minta aránya p-hat = 560/1000 = 0,56. Ebben az esetben azt mondjuk, hogy 0,56 a p pontbecslése, és általában ‘l Mindig p-hat használok a p becsléséhez. (Ismét megjegyezzük, hogy amikor a specifikus értékről (0,56) beszélünk, akkor a becslés kifejezést használjuk, és amikor általában a statisztikai p-hatról beszélünk, akkor a becslés kifejezést használjuk. Itt van ennek a példának a vizuális összefoglalása :

Did Értem ?: Pontbecslés

A pontbecslők kívánt tulajdonságai

Úgy érezheti, hogy mivel ez annyira intuitív, önállóan is kitalálhatta volna a pontbecslést, a egy teljes statisztikai tanfolyam előnye.Természetesen intuíciónk azt mondja nekünk, hogy a populáció átlagának (mu, µ) legjobb becslője az x-bar legyen, a p populációs arány legjobb becslője pedig a p-hat legyen.

A valószínűségelmélet ennél többet tesz; valójában magyarázatot ad (az intuíción kívül), hogy miért az x-bar és a p-hat a jó választás a µ (mu) és a p pontbecslőjeként. A Valószínűség egység Mintavételi eloszlások szakaszában megtudtuk az x-bar mintavételi eloszlását, és megállapítottuk, hogy amíg egy mintát véletlenszerűen veszünk, addig a mintaátlagok eloszlása pontosan a populáció átlagának középpontjában van.

Az x-bar statisztikánk tehát elfogulatlan becslő a µ-hez (mu). Bármelyik mintaátlag alacsonyabb lehet, mint a tényleges népességátlag, vagy nagyobbnak bizonyulhat. Hosszú távon azonban az ilyen mintavételi eszközök “célponton vannak”, mivel nem becsülik alá többé vagy ritkábban, mint amennyit túlbecsülnek.

Hasonlóképpen megtudtuk, hogy a minta arányának mintavételi eloszlása, p -hat, a p populációarányra összpontosul (mindaddig, amíg a mintát véletlenszerűen vesszük), így a p-hat elfogulatlan becslővé válik a p számára.

Amint a bevezetőben elmondtuk, a valószínűségelmélet alapvető szerepet játszik, amikor megállapítjuk a statisztikai következtetések eredményeit. Állításunk a minta átlaga és a minta felett arányban elfogulatlan becslők az első ilyen eset.

A mintavétel és a tervezés fontossága

Figyelje meg, hogy a mintavétel és a tervezés elvei mennyire fontosak a fenti eredményeinkhez: ha az amerikai felnőttek mintája (az előző oldal 2. példája) nem volt véletlenszerű, hanem főleg főiskolai hallgatók voltak benne, akkor 0,56 egy torzított becslés a p az összes olyan amerikai felnőttet, aki úgy véli, hogy a marihuánát legalizálni kell. rákos betegek marihuánája, akkor 0,56 lenne elfogult az alacsony vagy a magas oldalon.

Pontbecsléseink valóban elfogulatlan becslések a populációs paraméterre csak akkor, ha a minta véletlenszerű, és a vizsgálat megtervezése nem megfelelő hibás.

Normál hiba és a minta mérete

Nem csak a minta átlaga és a minta aránya a célponton, amennyiben a minták véletlenszerűek, de pontosságuk is javul a minta méretének növekedésével.

Ismét két “réteg” van itt, hogy ezt elmagyarázzuk.

Intuitív módon a nagyobb mintaméretek több információt nyújtanak, amelyekkel rögzíthetjük a valódi természete. Ezért arra számíthatunk, hogy a nagyobb mintából kapott mintaátlag és a minta aránya közelebb áll a populáció átlagához, illetve az arányához. Végső soron, amikor a teljes népességet mintavételezzük (amelyet népszámlálásnak nevezünk), a minta átlaga és a minta aránya pontosan egybe fog esni a népesség átlagával és a népesség arányával. Van itt egy másik réteg, amely megint abból származik, amiről megtudtuk a minta átlagának mintavételi eloszlása és a minta aránya. Használjuk a minta átlagát a magyarázatra.

Emlékezzünk vissza arra, hogy a minta x-bar átlagának mintavételi eloszlása, amint azt már korábban említettük, a µ (mu) populáció átlagra koncentrálódik, és standard hibája van (a statistic, x-bar) of

Ennek eredményeként a minta mérete n növekszik, az x-bar mintavételi eloszlása kevésbé terjed. Ez azt jelenti, hogy az x-bar nagyobb mintán alapuló értékei valószínűleg közelebb vannak a µ (mu) -hoz (ahogy az alábbi ábra is mutatja):

Hasonlóképpen, mivel a p-hat mintavételi eloszlása p középpontú és

amely a minta méretének növekedésével csökken, a p-hat értékei nagyobb valószínűséggel vannak közelebb a p-hez, ha a minta nagyobb.

Egy másik pontbecslő

A pontbecslő másik példája a minta szórás használata,

a populáció szórásának becsléséhez, σ (sigma).

Ezen a kurzuson nem foglalkozunk a populációs standard becslésével eltérés a saját érdekében, de mivel a minta átlagának standardizálásakor gyakran a minta szórását (szórásait) helyettesítjük σ (sigma) értékkel, érdemes kiemelni, hogy s unbia sed becslője a σ (sigma) esetében.

Ha a populáció szórásának becslőjében n – 1 helyett n-gyel osztanánk, akkor hosszú távon a minta varianciánk enyhe alábecsülést okozna.Az n – 1 által történő felosztás azt a célt szolgálja, hogy ezt a pontbecslőt elfogulatlanná tegyék.

Ennek oka, hogy az Exploratory Data Analysis egységben bevezetett s képletünk n – 1 helyett osztást jelent n helyett n, tény, hogy elfogulatlan becslőket szeretnénk használni a gyakorlatban.

Összegezzük

  • p-hat (minta arány) használunk p becslésként a p (népesség aránya) esetében. Elfogulatlan becslő: hosszú távú eloszlása p-re van központozva, amíg a minta véletlenszerű.
  • Az x-bar (mintaátlag) pontbecslőt használjuk. µ-re (mu, populációs átlag). Elfogulatlan becslő: hosszú távú eloszlása középpontjában µ (mu) áll, amíg a minta véletlenszerű.
  • Mindkét esetben minél nagyobb a minta mérete, annál pontosabb a pontbecslő. Más szavakkal: minél nagyobb a minta mérete, annál valószínűbb, hogy a minta átlaga (aránya) közel áll az ismeretlen populációs átlaghoz (arány).
Értettem ?: Pontbecslők tulajdonságai

Intervallumbecslés

A pontbecslés egyszerű és intuitív, ugyanakkor kissé problematikus is. Ennek oka:

Amikor a μ (mu) értéket becsüljük az x-bar minta átlagával, szinte garantáltan elkövetünk valamilyen hibát. Annak ellenére, hogy tudjuk, hogy az x-bar értékei μ (mu) körül esnek, nagyon valószínűtlen, hogy az x-bar értéke pontosan μ (mu) értéknél csökkenjen.

Tekintettel arra, hogy az ilyen hibák élethelyzet a pontbecslésekhez (pusztán azzal a ténnyel, hogy becslésünket egy olyan mintára alapozzuk, amely a népesség kis hányada), ezek a becslések önmagukban korlátozottan hasznosak, hacsak nem tudjuk számszerűsíteni a becslési hiba. Az intervallum becslése megoldja ezt a problémát. Az intervallumbecslés ötlete tehát az egyszerű pontbecslések fejlesztése azáltal, hogy információkat szolgáltat a csatolt hiba nagyságáról.

Ebben a bevezetőben példákat fogunk adni, amelyek alapos megérzést adnak a következőkről: az intervallumbecslés alapgondolata.

PÉLDA:

Vizsgáljuk meg azt a példát, amelyet a pontbecslés szakaszban tárgyaltunk:

Tegyük fel, hogy kíváncsiak vagyunk a Smart University-re (SU) járó hallgatók IQ-szintjének tanulmányozására. Különösen (mivel az IQ szint egy kvantitatív változó) vagyunk érdekeltek, hogy megbecsüljük az μ (mu) értéket, az SU összes hallgatójának átlagos IQ szintjét. 100 SU hallgatóból véletlenszerű mintát választottunk, és az (IQ) átlag IQ szintjük 115 (x-bar) volt.

A pontbecslésben az x-bar = 115 értéket használtuk μ (mu) pontbecslésévé. Arról azonban fogalmunk sem volt, hogy mi lehet az ilyen becsléssel járó becslési hiba. Az intervallumbecslés egy ponttal továbbviszi a pontbecslést, és ilyesmit mond:

“95% -ig biztos vagyok abban, hogy az x-bar = 115 pontbecslés használatával becsülöm meg a μ (mu) -ot, és nem mint 3 IQ pont. Más szavakkal, 95% -ban biztos vagyok abban, hogy μ (mu) a 115-ös 3-on belül vagy 112 (115 – 3) és 118 (115 + 3) között van. “

Mégis másik módja annak, hogy ugyanezt mondjam: 95% -ban biztos vagyok abban, hogy μ (mu) valahol az intervallumban van (vagy be van fedve) (112,118). (Megjegyzés: Ezen a ponton nem kell aggódnia, vagy megpróbálnia kitalálni , hogyan kaptuk ezeket a számokat. Ezt később meg fogjuk tenni. Itt csak annyit akarunk tenni, hogy biztosan megértsük az ötletet.)

Vegye figyelembe, hogy bár a pontbecslés csak egy számot adott meg becslésként az μ-hez (mu) a 115-ből, az intervallumbecslés a μ (mu) “elfogadható értékeinek” teljes intervallumát adja (112 és 118 között), és hozzáteszi a magabiztosságunk szintjét is, hogy ez az intervallum valóban tartalmazza a μ (mu) értékét becslésünk (példánkban 95% -os megbízhatóság). Az intervallumot (112, 118) ezért “95% -os konfidencia intervallumnak nevezzük μ (mu) esetében.”

Nézzünk meg egy másik példát:

PÉLDA:

Vizsgáljuk meg a második példát a pontbecslés szakaszból.

Tegyük fel, hogy érdekelnek bennünket az amerikai felnőttek véleménye a Különösen a p paraméter érdekel minket, az amerikai felnőttek aránya, akik úgy gondolják, hogy a marihuánát legalizálni kell.

Ha p-t, a népesség arányát egyetlen számmal akartuk megbecsülni a minta alapján intuitív értelmű lenne a megfelelő mennyiséget használni a mintában, a minta aránya p-hat = 560/1000 = 0,56.

Az intervallum becslés ezt egy lépéssel tovább venné, és mondana valamit mint:

“90% -ig biztos vagyok benne, hogy a használatával A valódi népességarány becsléséhez 0,56, p, legfeljebb 0,03 (vagy 3 százalékpont) vagyok (vagy hibám van). Más szavakkal, 90% -ban bízom abban, hogy p tényleges értéke valahol 0 között van.53 (0,56 – 0,03) és 0,59 (0,56 + 0,03). ”

Ennek egy másik módja:” 90% -ban bízom abban, hogy p-t lefedi az intervallum (0,53, 0,59). ”

Ebben a példában a (0.53, 0.59) 90% -os konfidencia intervallum a p számára.

Összefoglaljuk

A két példa megmutatta hogy az intervallumbecslés mögött az az elképzelés áll, hogy ahelyett, hogy csak egy számot adna meg egy ismeretlen érdekes paraméter becsléséhez, a paraméter elfogadható értékeinek intervallumát adja meg, valamint egy olyan bizalmi szintet, hogy a paraméter értékét lefedi ez az intervallum. / p>

Most részletesebben áttekintjük és megtudjuk, hogyan hozhatók létre és hogyan értelmezhetők ezek a konfidencia intervallumok. Mint látni fogod, a Valószínűség egység „Elosztási mintavétel” szakaszában kidolgozott ötletek ismét nagyon fontos lesz. Emlékezzünk arra, hogy a pontbecsléshez a mintavételi eloszlások megértése a statisztikánk elfogulatlanságának ellenőrzéséhez vezet, és pontos képleteket ad a statisztikáink standard hibájához.

Kezdjük azzal, hogy megbeszéljük a populáció átlag μ (mu), majd később beszélje meg a populációs arány konfidencia intervallumait. p.

Címkézve: CO-4, Becslés, Becslés, Intervallum Becslés, LO 4,29, Paraméter, Pont Becslés, Pontbecslő, mintaméret, mintavétel, mintavételi eloszlás, statisztika standard hibája, statisztika, tanulmányterv, elfogulatlan

Leave a Reply

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük