- Johdanto
- Pistearviointi
- Pisteen halutut ominaisuudet Estimaattorit
- Näytteenoton ja suunnittelun merkitys
- Standardivirhe ja otoksen koko
- Toinen pistearvioija (näytteen keskihajonta)
- Pisteen yhteenveto Estimointi
- Johdanto intervalliarviointiin
- Yhteenveto
Johdanto
Johdannossa Johtopäätökset määritetyt piste-estimaatit ja inte rval-estimaatit.
- Piste-estimoinnissa estimoimme tuntemattoman parametrin yhdellä näytetiedoista lasketulla luvulla.
- Aikavälillä estimoimalla arvioimme tuntemattoman parametrin käyttämällä arvoväliä, joka todennäköisesti sisältää kyseisen parametrin todellisen arvon (ja kerro, kuinka varmoja olemme siitä, että tämä väli todella tallentaa parametrin todellisen arvon).
Tässä osassa esitellään luottamusvälin käsite ja opitaan laskemaan luottamusvälit populaatiokeskiarvoille ja populaatioosuuksille (kun tietyt ehdot täyttyvät).
Yksikössä 4B tarkastelemme nähdä, että luottamusvälit ovat hyödyllisiä aina, kun haluamme käyttää tietoja tuntemattoman populaatioparametrin arvioimiseksi, vaikka tämä parametri estimoidaan useilla muuttujilla (kuten tapauksemme: CC, CQ, QQ).
Esimerkiksi , voimme rakentaa luottamusvälit regressioyhtälön kaltevuudelle tai korrelaatiokertoimelle. Tällöin käytämme tietojasi aina väliarviointiin tuntemattomalle populaatioparametrille (TOSI-kaltevuus tai TOSI-korrelaatiokerroin).
Pisteennuste
Piste-estimointi on tilastollisen päättelyn muoto, jossa otosdatan perusteella arvioimme tuntemattoman parametrin kiinnostavaa käyttämällä yhtä arvoa (tästä johtuen nimipistearvio). Kuten seuraavat kaksi esimerkkiä havainnollistavat, tämä päätelmämuoto on melko intuitiivinen.
ESIMERKKI:
Oletetaan, että olemme kiinnostuneita tutkimaan älykkään yliopiston (SU) opiskelijoiden älykkyysosatasot. Erityisesti (koska IQ-taso on kvantitatiivinen muuttuja), olemme kiinnostuneita arvioimaan µ (mu), kaikkien SU-opiskelijoiden keskimääräisen IQ-tason.
Valittiin satunnainen 100 SU-opiskelijan otos, ja niiden (otos) keskimääräisen IQ-tason todettiin olevan 115 (x-bar).
Jos halusimme arvioida µ (mu), populaation keskimääräinen IQ-taso yhdellä luvulla otoksen perusteella , olisi järkevää käyttää vastaavaa määrää näytteessä, näytekeskiarvo, joka on 115. Sanomme, että 115 on pistearvio µ (mu): lle, ja yleensä käytämme aina näytteen keskiarvoa (x -bar) p: n estimaattorina u (mu): lle. (Huomaa, että kun puhumme spesifisestä arvosta (115), käytämme termiä estimaatti ja kun puhumme yleensä tilastosta x-palkki, käytämme termiä estimaattori. Seuraava esimerkki tiivistää tämän esimerkin:
Tässä on toinen esimerkki.
ESIMERKKI:
Oletetaan, että olemme kiinnostuneita Yhdysvaltojen aikuisten mielipiteistä marihuanan käytön laillistamisesta. Erityisesti olemme kiinnostuneita parametrista p, Amerikkalaiset aikuiset, jotka uskovat, että marihuana olisi laillistettava.
Oletetaan, että 1000 yhdysvaltalaisen aikuisen mielipidekyselyssä 560 heistä uskoo, että marihuana olisi laillistettava. Jos haluaisimme arvioida p, väestöosuus käyttämällä yhtä lukua näytteessä olisi järkevää käyttää vastaavaa määrää näytteessä, näytteen osuus p-hat = 560/1000 = 0,56. Sanomme tässä tapauksessa, että 0,56 on p: n piste-estimaatti, ja yleensä ”l Käytän aina p-hattua p-pisteen estimaattorina. (Huomaa vielä kerran, että kun puhumme spesifisestä arvosta (0,56), käytämme termiä estimaatti ja kun puhumme yleensä tilastollisesta p-hatusta, käytämme termiä estimaattori. Tässä on visuaalinen yhteenveto tästä esimerkistä :
Pisteennusteiden halutut ominaisuudet
Saatat tuntea, että koska se on niin intuitiivinen, olisit voinut selvittää pistearvioinnin yksin, jopa ilman hyötyä koko tilastokurssista.Tietysti intuitiomme kertoo meille, että populaation keskiarvon (mu, µ) parhaan estimaattorin tulisi olla x-palkki ja populaation osuuden p paras estimaattorin p-hat.
Todennäköisyysteoria tekee enemmän kuin tämä; se todella antaa selityksen (intuition ulkopuolella), miksi x-palkki ja p-hat ovat hyviä valintoja pistearvioijina µ (mu): lle ja p: lle. Todennäköisyysyksikön näytteenottojakaumat -osiossa saimme tietää x-baarin näytteenottojakaumasta ja havaitsimme, että niin kauan kuin näyte otetaan sattumanvaraisesti, näytekeskiarvojen jakauma keskitetään täsmälleen populaation keskiarvon arvoon. p>
Tämän vuoksi tilastomme, x-palkin, sanotaan olevan puolueeton estimaatti µ: lle (mu). Mikä tahansa tietty otoskeskiarvo voi osoittautua pienemmäksi kuin todellinen populaatiokeskiarvo tai se voi osoittautua enemmän. Mutta pitkällä aikavälillä tällaiset otantavälineet ovat ”tavoitteessa”, koska ne eivät aliarvioi enemmän tai harvemmin kuin yliarvioivat.
Samoin saimme tietää, että otososuuden otosjakauma, p -hat, on keskitetty populaatioosuuteen p (kunhan näyte otetaan satunnaisesti), mikä tekee p-hatista puolueettoman estimaattorin p: lle.
Kuten johdannossa todetaan, todennäköisyysteorialla on keskeinen rooli määritettäessä tuloksia tilastollisten päättelyjen varalta. Väitteemme otoksen keskiarvon ja otoksen yläpuolella osuus on puolueeton estimaattori on ensimmäinen tällainen esimerkki.
Näytteenoton ja suunnittelun merkitys
Huomaa, kuinka tärkeitä näytteenoton ja suunnittelun periaatteet ovat edellä oleviin tuloksiimme: jos aikuisten yhdysvaltalaisten otos (esimerkki 2 edellisellä sivulla) ei ollut satunnainen, vaan sisälsi sen sijaan pääasiassa opiskelijoita, sitten 0,56 olisi puolueellinen arvio p: lle, proportio kaikille yhdysvaltalaisille aikuisille, jotka uskovat, että marihuana olisi laillistettava.
Jos kyselyn suunnittelu oli virheellinen, esimerkiksi ladatkaa kysymys muistutuksella koviin huumeisiin johtavista marihuanan vaaroista tai muistutus hyödyistä marihuanaa syöpäpotilaille, 0,56 olisi puolueellinen vastaavasti matalalla tai korkealla puolella.
Vikavirhe ja otoksen koko
Näytteen keskiarvo ja näytteen osuus kohteessa ovat niin kauan kuin näytteet ovat satunnaisia, mutta niiden tarkkuus paranee näytteen koon kasvaessa.
Tässä on jälleen kaksi ”kerrosta” tämän selittämiseksi.
Muistakaa, että näytekeskiarvon x-bar näytteenottojakauma on, kuten aiemmin mainitsimme, keskitetty populaation keskiarvoon µ (mu) ja sillä on standardivirhe (keskiarvopoikkeama statistic, x-bar) of
Tämän seurauksena otoksen koko n kasvaa, x-palkin näytteenottojakauma levittyy vähemmän. Tämä tarkoittaa, että suurempaan otokseen perustuvat x-palkin arvot ovat todennäköisesti lähempänä µ (mu): ta (kuten alla oleva kuva kuvaa):
Vastaavasti, koska p-hatun otosjakauma on keskitetty p: ään ja sillä on
joka pienenee otoksen koon kasvaessa, p-hatun arvot ovat todennäköisesti lähempänä p: tä, kun otoksen koko on suurempi.
Toinen pistearvioija
Toinen esimerkki piste-estimaattorista on otoksen keskihajonnan käyttäminen,
populaation keskihajonnan arvioimiseksi, σ (sigma).
Tällä kurssilla emme ole kiinnostuneita populaatiostandardin arvioinnista poikkeama itsensä vuoksi, mutta koska korvataan usein näytteen keskihajonta (t) σ: lla (sigma) otoskeskiarvon standardoinnissa, on syytä huomauttaa, että s on unibia sed estimaattori σ: lle (sigma).
Jos populaation keskihajonnan estimaattorissamme olisi jaettu n: llä n – 1: n sijasta, niin pitkällä aikavälillä otosvarianssimme olisi syyllinen vähäiseen aliarviointiin.Jakaminen n – 1: llä saavuttaa tavoitteen, jonka mukaan tämä piste-estimaattori on puolueeton.
Syy, että Exploratory Data Analysis -yksikössä käyttöön otettu s-kaava sisältää jakamisen n – 1: llä n: n sijasta, on tosiasia, että haluamme käyttää puolueettomia estimaattoreita käytännössä.
Yhteenveto
- Käytämme p-hattua (otososuus) p-estimaattorina p: lle (populaatioosuus). Se on puolueeton estimaattori: sen pitkän aikavälin jakauma keskittyy p: ään, kunhan näyte on satunnainen.
- Pisteestimaattorina käytämme x-palkkia (otoskeskiarvo). for u (mu, populaation keskiarvo). Se on puolueeton estimaattori: sen pitkän aikavälin jakauma on keskitetty kohtaan µ (mu) niin kauan kuin näyte on satunnainen.
- Molemmissa tapauksissa, mitä suurempi otoksen koko, mitä tarkempi pisteestimaattori on. Toisin sanoen, mitä suurempi otoksen koko, sitä todennäköisempää on, että otoksen keskiarvo (osuus) on lähellä tuntematonta populaation keskiarvoa (osuus).
Intervalliarviointi
Pistearviointi on yksinkertaista ja intuitiivista, mutta myös hieman ongelmallista. Tästä syystä:
Kun arvioimme μ (mu) näytteen keskimääräisen x-palkin avulla, voimme melkein taata jonkinlaisen virheen. Vaikka tiedämme, että x-palkin arvot laskevat μ: n (mu) ympärille, on hyvin epätodennäköistä, että x-palkin arvo putoaa tarkalleen μ: lla (mu).
Koska tällaiset virheet ovat piste-estimaattien tosiasia (pelkästään tosiasia, että perustamme arviomme yhteen otokseen, joka on pieni osa populaatiosta), nämä arviot ovat sinänsä rajallisia, ellei pystymme määrittelemään arviointivirhe. Intervalliarviointi korjaa tämän ongelman. Intervalliarvioinnin ideana on siis parantaa yksinkertaisia piste-estimaatteja toimittamalla tietoja liitteenä olevan virheen koosta.
Tässä johdannossa annamme esimerkkejä, jotka antavat sinulle vankan intuition intervalliarvioinnin perusajatus.
ESIMERKKI:
Harkitse esimerkkiä, josta keskustelimme piste-estimointiosassa: p Oletetaan, että olemme kiinnostuneita tutkimaan Smart Universityyn (SU) osallistuvien opiskelijoiden älykkyysosamääriä. Erityisesti (koska IQ-taso on kvantitatiivinen muuttuja), olemme kiinnostuneita arvioimaan μ: n (mu), kaikkien SU-opiskelijoiden keskimääräisen IQ-tason. Valittiin satunnainen 100 SU-opiskelijan otos, ja heidän (otos) keskimääräisen älykkyysosansa todettiin olevan 115 (x-bar).
Piste-estimoinnissa käytimme x-bar = 115 pisteestimaattina μ (mu): lle. Meillä ei kuitenkaan ollut aavistustakaan siitä, mikä tällaiseen estimointiin liittyvä arviointivirhe voi olla. Intervalliarviointi vie piste-estimoinnin vielä pidemmälle ja sanoo jotain seuraavaa:
”Olen 95% varma, että käyttämällä piste-estimaattia x-bar = 115 estimoimaan μ (mu), en poistu enää kuin 3 IQ-pistettä. Toisin sanoen olen 95% varma siitä, että μ (mu) on 3: n tai 115: n sisällä tai välillä 112 (115 – 3) – 118 (115 + 3). ”
Silti toinen tapa sanoa sama asia on: Olen 95% varma siitä, että μ (mu) on jonnekin aikavälillä (tai peitetty) (112,118). (Kommentti: Tässä vaiheessa sinun ei pitäisi huolehtia tai yrittää selvittää , miten saimme nämä numerot. Teemme sen myöhemmin. Ainoa mitä tässä asiassa haluamme tehdä, on varmistaa, että ymmärrät idean.)
Huomaa, että vaikka piste-estimointi antoi vain yhden luvun arviona μ: lle (mu) 115: stä, intervalliarviointi antaa kokonaisvälin ”uskottavia arvoja” μ (mu): lle (välillä 112 ja 118), ja kiinnittää myös luottamuksemme tason, että tämä intervalli todella sisältää μ (mu): n arvon arviomme (esimerkissämme 95%: n luottamus). Väliä (112, 118) kutsutaan siksi ”μ (mu): n 95%: n luottamusväliksi”.
Katsotaanpa toista esimerkkiä:
ESIMERKKI:
Tarkastellaan toista esimerkkiä piste-estimoinnin osiosta.
Oletetaan, että olemme kiinnostuneita Yhdysvaltain aikuisten mielipiteistä Erityisesti meitä kiinnostaa parametri p, niiden amerikkalaisten aikuisten osuus, jotka uskovat, että marihuana olisi laillistettava.
Oletetaan, että 1000 yhdysvaltalaisen aikuisen kyselyn mukaan 560 heistä uskoo marihuanan olevan laillista.
Jos halusimme arvioida p, populaatioosuus yhdellä luvulla otoksen perusteella olisi järkevää käyttää vastaavaa määrää näytteessä, näytteen osuus p-hat = 560/1000 = 0,56.
Intervalliarviointi veisi tämän askeleen pidemmälle ja sanoisi jotain kuten:
”Olen 90% varma siitä, että käytän 0,56 todellisen väestöosuuden arvioimiseksi, p, olen poissa (tai minulla on virhe) enintään 0,03 (tai 3 prosenttiyksikköä). Toisin sanoen olen 90% varma siitä, että p: n todellinen arvo on välillä 0.53 (0,56 – 0,03) ja 0,59 (0,56 + 0,03). ”
Vielä yksi tapa sanoa tämä on:” Olen 90% varma, että p kuuluu väli (0,53, 0,59). ”
Tässä esimerkissä (0.53, 0.59) on 90%: n luottamusväli sivulle.
Yhteenveto
Kaksi esimerkkiä osoitti meille että aikavälin estimoinnin taustalla on sen sijaan, että annettaisiin vain yksi numero tuntemattoman kiinnostavan parametrin estimoimiseksi, tarjotaan parametrin uskottavien arvojen väli plus luotettavuustaso siitä, että parametrin arvo kuuluu tällä aikavälillä. / p>
Menemme nyt yksityiskohtaisemmin ja opimme, miten nämä luottamusvälit luodaan ja tulkitaan asiayhteydessä. Kuten näette, todennäköisyysyksikön ”Näytteiden jakelu” -osiossa kehitetyt ideat tulee jälleen olemaan erittäin tärkeä. Muistathan, että pistearviointia varten ymmärryksemme otosjakaumista johtaa tilastojemme puolueettomuuteen ja antaa meille tarkat kaavat tilastojemme vakiovirheille.
Aloitamme keskustelemalla populaation keskiarvo μ (mu) ja keskustele myöhemmin väestöosuuden luottamusväleistä s.
Tunnisteet: CO-4, Estimate, Estimator, Interval Estimate, LO 4.29, Parameter, Point Estimate, Pisteen estimaattori, otoksen koko, näytteenotto, näytteen jakelu, tilastovirhe, tilasto, tutkimuksen suunnittelu, puolueeton