- Bevezetés
- Pontbecslés
- A pont kívánt tulajdonságai Becslők
- A mintavétel és a tervezés fontossága
- Standard hiba és a minta mérete
- Egy másik pontbecslő (minta szórása)
- A pont összefoglalása Becslés
- Bevezetés az intervallum becslésbe
- Összefoglaljuk
Bevezetés
Bevezetésünkben a következtetéshez meghatározott pontbecslések és inte rval becslések.
- Pontbecslésben egy ismeretlen paramétert becsülünk egyetlen szám felhasználásával, amelyet a minta adatai alapján számolunk.
- Intervallumban becsléskor egy ismeretlen paramétert becsülünk meg egy olyan intervallum felhasználásával, amely valószínűleg tartalmazza a paraméter valódi értékét (és állítsuk be, mennyire magabiztosak vagyunk abban, hogy ez az intervallum valóban rögzíti a paraméter valódi értékét).
Ebben a részben bemutatjuk a konfidencia intervallum fogalmát, és megtanuljuk kiszámítani a konfidencia intervallumokat a populáció átlagához és a populáció arányához (ha bizonyos feltételek teljesülnek).
A 4B egységben a lásd, hogy a konfidencia intervallumok akkor hasznosak, amikor adatokat akarunk használni egy ismeretlen populációs paraméter becsléséhez, még akkor is, ha ezt a paramétert több változó (például eseteink: CC, CQ, QQ) használatával becsüljük meg.
Például , konfidencia intervallumokat készíthetünk a regressziós egyenlet meredekségéhez vagy a korrelációs együtthatóhoz. Ennek során mindig felhasználjuk adatainkat egy ismeretlen populációs paraméter (TRUE meredekség vagy TRUE korrelációs együttható) intervallumbecsléséhez.
Pontbecslés
A pontbecslés a statisztikai következtetés egyik formája, amelyben a minta adatai alapján becsüljük meg az ismeretlen paramétert érdekes egyetlen érték felhasználásával (ezért a névpont becslése). Amint azt a következő két példa szemlélteti, a következtetésnek ez a formája meglehetősen intuitív.
PÉLDA:
Tegyük fel, hogy érdekeltek vagyunk a tanulmányozásban a Smart University (SU) hallgatóinak IQ szintje. Különösen (mivel az IQ szint kvantitatív változó) vagyunk érdekeltek, hogy megbecsüljük az µ (mu) értéket, az összes SU-ban tanuló diák átlagos IQ-szintjét.
100 SU-s diákból véletlenszerű mintát választottunk, és a (minta) átlagos IQ szintjük 115 (x-bar) volt.
Ha a minta alapján egyetlen számmal akartuk megbecsülni a μ (mu) értéket, akkor a populáció átlag IQ szintjét. , intuitív értelme lenne a megfelelő mennyiséget használni a mintában, a minta átlagát, amely 115. Azt mondjuk, hogy 115 a µ (mu) pontbecslése, és általában mindig a minta átlagát (x -bar) mint µ (mu) pontbecslője. (Vegye figyelembe, hogy amikor a konkrét értékről (115) beszélünk, akkor a becslés kifejezést használjuk, és amikor általában az x-oszlop statisztikájáról beszélünk, akkor a becslő kifejezést használjuk. A következő ábra ezt a példát foglalja össze:
Itt van egy másik példa.
PÉLDA:
Tegyük fel, hogy érdekelnek az amerikai felnőttek véleménye a marihuána használatának legalizálásáról. Különösen a p paraméter, a Amerikai felnőttek, akik úgy gondolják, hogy a marihuánát legalizálni kell.
Tegyük fel, hogy egy 1000 amerikai felnőtt közvélemény-kutatása szerint 560-an úgy vélik, hogy a marihuánát legalizálni kell. Ha p-t szeretnénk megbecsülni, a népesség arányát egyetlen szám alapján a mintán intuitív értelme lenne a megfelelő mennyiséget használni a mintában, a minta aránya p-hat = 560/1000 = 0,56. Ebben az esetben azt mondjuk, hogy 0,56 a p pontbecslése, és általában ‘l Mindig p-hat használok a p becsléséhez. (Ismét megjegyezzük, hogy amikor a specifikus értékről (0,56) beszélünk, akkor a becslés kifejezést használjuk, és amikor általában a statisztikai p-hatról beszélünk, akkor a becslés kifejezést használjuk. Itt van ennek a példának a vizuális összefoglalása :
A pontbecslők kívánt tulajdonságai
Úgy érezheti, hogy mivel ez annyira intuitív, önállóan is kitalálhatta volna a pontbecslést, a egy teljes statisztikai tanfolyam előnye.Természetesen intuíciónk azt mondja nekünk, hogy a populáció átlagának (mu, µ) legjobb becslője az x-bar legyen, a p populációs arány legjobb becslője pedig a p-hat legyen.
A valószínűségelmélet ennél többet tesz; valójában magyarázatot ad (az intuíción kívül), hogy miért az x-bar és a p-hat a jó választás a µ (mu) és a p pontbecslőjeként. A Valószínűség egység Mintavételi eloszlások szakaszában megtudtuk az x-bar mintavételi eloszlását, és megállapítottuk, hogy amíg egy mintát véletlenszerűen veszünk, addig a mintaátlagok eloszlása pontosan a populáció átlagának középpontjában van.
Az x-bar statisztikánk tehát elfogulatlan becslő a µ-hez (mu). Bármelyik mintaátlag alacsonyabb lehet, mint a tényleges népességátlag, vagy nagyobbnak bizonyulhat. Hosszú távon azonban az ilyen mintavételi eszközök “célponton vannak”, mivel nem becsülik alá többé vagy ritkábban, mint amennyit túlbecsülnek.
Hasonlóképpen megtudtuk, hogy a minta arányának mintavételi eloszlása, p -hat, a p populációarányra összpontosul (mindaddig, amíg a mintát véletlenszerűen vesszük), így a p-hat elfogulatlan becslővé válik a p számára.
Amint a bevezetőben elmondtuk, a valószínűségelmélet alapvető szerepet játszik, amikor megállapítjuk a statisztikai következtetések eredményeit. Állításunk a minta átlaga és a minta felett arányban elfogulatlan becslők az első ilyen eset.
A mintavétel és a tervezés fontossága
Figyelje meg, hogy a mintavétel és a tervezés elvei mennyire fontosak a fenti eredményeinkhez: ha az amerikai felnőttek mintája (az előző oldal 2. példája) nem volt véletlenszerű, hanem főleg főiskolai hallgatók voltak benne, akkor 0,56 egy torzított becslés a p az összes olyan amerikai felnőttet, aki úgy véli, hogy a marihuánát legalizálni kell. rákos betegek marihuánája, akkor 0,56 lenne elfogult az alacsony vagy a magas oldalon.
Normál hiba és a minta mérete
Nem csak a minta átlaga és a minta aránya a célponton, amennyiben a minták véletlenszerűek, de pontosságuk is javul a minta méretének növekedésével.
Ismét két “réteg” van itt, hogy ezt elmagyarázzuk.
Emlékezzünk vissza arra, hogy a minta x-bar átlagának mintavételi eloszlása, amint azt már korábban említettük, a µ (mu) populáció átlagra koncentrálódik, és standard hibája van (a statistic, x-bar) of
Ennek eredményeként a minta mérete n növekszik, az x-bar mintavételi eloszlása kevésbé terjed. Ez azt jelenti, hogy az x-bar nagyobb mintán alapuló értékei valószínűleg közelebb vannak a µ (mu) -hoz (ahogy az alábbi ábra is mutatja):
Hasonlóképpen, mivel a p-hat mintavételi eloszlása p középpontú és
amely a minta méretének növekedésével csökken, a p-hat értékei nagyobb valószínűséggel vannak közelebb a p-hez, ha a minta nagyobb.
Egy másik pontbecslő
A pontbecslő másik példája a minta szórás használata,
a populáció szórásának becsléséhez, σ (sigma).
Ezen a kurzuson nem foglalkozunk a populációs standard becslésével eltérés a saját érdekében, de mivel a minta átlagának standardizálásakor gyakran a minta szórását (szórásait) helyettesítjük σ (sigma) értékkel, érdemes kiemelni, hogy s unbia sed becslője a σ (sigma) esetében.
Ha a populáció szórásának becslőjében n – 1 helyett n-gyel osztanánk, akkor hosszú távon a minta varianciánk enyhe alábecsülést okozna.Az n – 1 által történő felosztás azt a célt szolgálja, hogy ezt a pontbecslőt elfogulatlanná tegyék.
Ennek oka, hogy az Exploratory Data Analysis egységben bevezetett s képletünk n – 1 helyett osztást jelent n helyett n, tény, hogy elfogulatlan becslőket szeretnénk használni a gyakorlatban.
Összegezzük
- p-hat (minta arány) használunk p becslésként a p (népesség aránya) esetében. Elfogulatlan becslő: hosszú távú eloszlása p-re van központozva, amíg a minta véletlenszerű.
- Az x-bar (mintaátlag) pontbecslőt használjuk. µ-re (mu, populációs átlag). Elfogulatlan becslő: hosszú távú eloszlása középpontjában µ (mu) áll, amíg a minta véletlenszerű.
- Mindkét esetben minél nagyobb a minta mérete, annál pontosabb a pontbecslő. Más szavakkal: minél nagyobb a minta mérete, annál valószínűbb, hogy a minta átlaga (aránya) közel áll az ismeretlen populációs átlaghoz (arány).
Intervallumbecslés
A pontbecslés egyszerű és intuitív, ugyanakkor kissé problematikus is. Ennek oka:
Amikor a μ (mu) értéket becsüljük az x-bar minta átlagával, szinte garantáltan elkövetünk valamilyen hibát. Annak ellenére, hogy tudjuk, hogy az x-bar értékei μ (mu) körül esnek, nagyon valószínűtlen, hogy az x-bar értéke pontosan μ (mu) értéknél csökkenjen.
Tekintettel arra, hogy az ilyen hibák élethelyzet a pontbecslésekhez (pusztán azzal a ténnyel, hogy becslésünket egy olyan mintára alapozzuk, amely a népesség kis hányada), ezek a becslések önmagukban korlátozottan hasznosak, hacsak nem tudjuk számszerűsíteni a becslési hiba. Az intervallum becslése megoldja ezt a problémát. Az intervallumbecslés ötlete tehát az egyszerű pontbecslések fejlesztése azáltal, hogy információkat szolgáltat a csatolt hiba nagyságáról.
Ebben a bevezetőben példákat fogunk adni, amelyek alapos megérzést adnak a következőkről: az intervallumbecslés alapgondolata.
PÉLDA:
Vizsgáljuk meg azt a példát, amelyet a pontbecslés szakaszban tárgyaltunk:
Tegyük fel, hogy kíváncsiak vagyunk a Smart University-re (SU) járó hallgatók IQ-szintjének tanulmányozására. Különösen (mivel az IQ szint egy kvantitatív változó) vagyunk érdekeltek, hogy megbecsüljük az μ (mu) értéket, az SU összes hallgatójának átlagos IQ szintjét. 100 SU hallgatóból véletlenszerű mintát választottunk, és az (IQ) átlag IQ szintjük 115 (x-bar) volt.
A pontbecslésben az x-bar = 115 értéket használtuk μ (mu) pontbecslésévé. Arról azonban fogalmunk sem volt, hogy mi lehet az ilyen becsléssel járó becslési hiba. Az intervallumbecslés egy ponttal továbbviszi a pontbecslést, és ilyesmit mond:
“95% -ig biztos vagyok abban, hogy az x-bar = 115 pontbecslés használatával becsülöm meg a μ (mu) -ot, és nem mint 3 IQ pont. Más szavakkal, 95% -ban biztos vagyok abban, hogy μ (mu) a 115-ös 3-on belül vagy 112 (115 – 3) és 118 (115 + 3) között van. “
Mégis másik módja annak, hogy ugyanezt mondjam: 95% -ban biztos vagyok abban, hogy μ (mu) valahol az intervallumban van (vagy be van fedve) (112,118). (Megjegyzés: Ezen a ponton nem kell aggódnia, vagy megpróbálnia kitalálni , hogyan kaptuk ezeket a számokat. Ezt később meg fogjuk tenni. Itt csak annyit akarunk tenni, hogy biztosan megértsük az ötletet.)
Vegye figyelembe, hogy bár a pontbecslés csak egy számot adott meg becslésként az μ-hez (mu) a 115-ből, az intervallumbecslés a μ (mu) “elfogadható értékeinek” teljes intervallumát adja (112 és 118 között), és hozzáteszi a magabiztosságunk szintjét is, hogy ez az intervallum valóban tartalmazza a μ (mu) értékét becslésünk (példánkban 95% -os megbízhatóság). Az intervallumot (112, 118) ezért “95% -os konfidencia intervallumnak nevezzük μ (mu) esetében.”
Nézzünk meg egy másik példát:
PÉLDA:
Vizsgáljuk meg a második példát a pontbecslés szakaszból.
Tegyük fel, hogy érdekelnek bennünket az amerikai felnőttek véleménye a Különösen a p paraméter érdekel minket, az amerikai felnőttek aránya, akik úgy gondolják, hogy a marihuánát legalizálni kell.
Ha p-t, a népesség arányát egyetlen számmal akartuk megbecsülni a minta alapján intuitív értelmű lenne a megfelelő mennyiséget használni a mintában, a minta aránya p-hat = 560/1000 = 0,56.
Az intervallum becslés ezt egy lépéssel tovább venné, és mondana valamit mint:
“90% -ig biztos vagyok benne, hogy a használatával A valódi népességarány becsléséhez 0,56, p, legfeljebb 0,03 (vagy 3 százalékpont) vagyok (vagy hibám van). Más szavakkal, 90% -ban bízom abban, hogy p tényleges értéke valahol 0 között van.53 (0,56 – 0,03) és 0,59 (0,56 + 0,03). ”
Ennek egy másik módja:” 90% -ban bízom abban, hogy p-t lefedi az intervallum (0,53, 0,59). ”
Ebben a példában a (0.53, 0.59) 90% -os konfidencia intervallum a p számára.
Összefoglaljuk
A két példa megmutatta hogy az intervallumbecslés mögött az az elképzelés áll, hogy ahelyett, hogy csak egy számot adna meg egy ismeretlen érdekes paraméter becsléséhez, a paraméter elfogadható értékeinek intervallumát adja meg, valamint egy olyan bizalmi szintet, hogy a paraméter értékét lefedi ez az intervallum. / p>
Most részletesebben áttekintjük és megtudjuk, hogyan hozhatók létre és hogyan értelmezhetők ezek a konfidencia intervallumok. Mint látni fogod, a Valószínűség egység „Elosztási mintavétel” szakaszában kidolgozott ötletek ismét nagyon fontos lesz. Emlékezzünk arra, hogy a pontbecsléshez a mintavételi eloszlások megértése a statisztikánk elfogulatlanságának ellenőrzéséhez vezet, és pontos képleteket ad a statisztikáink standard hibájához.
Kezdjük azzal, hogy megbeszéljük a populáció átlag μ (mu), majd később beszélje meg a populációs arány konfidencia intervallumait. p.
Címkézve: CO-4, Becslés, Becslés, Intervallum Becslés, LO 4,29, Paraméter, Pont Becslés, Pontbecslő, mintaméret, mintavétel, mintavételi eloszlás, statisztika standard hibája, statisztika, tanulmányterv, elfogulatlan