- Inleiding
- Puntschatting
- Gewenste eigenschappen van punt Schatters
- Belang van steekproef en ontwerp
- Standaardfout en steekproefomvang
- Nog een puntschatter (steekproefstandaarddeviatie)
- Samenvatting van punt Schatting
- Inleiding tot intervalschatting
- Laten we samenvatten
Inleiding
In onze inleiding tot inferentie gedefinieerde puntschattingen en inte rval-schattingen.
- Bij puntschatting schatten we een onbekende parameter met behulp van een enkel getal dat wordt berekend op basis van de voorbeeldgegevens.
- In interval schatting, schatten we een onbekende parameter met behulp van een interval van waarden die waarschijnlijk de werkelijke waarde van die parameter bevatten (en geven aan hoe zeker we zijn dat dit interval inderdaad de werkelijke waarde van de parameter vastlegt).
In deze sectie introduceren we het concept van een betrouwbaarheidsinterval en leren we betrouwbaarheidsintervallen te berekenen voor populatiegemiddelden en populatieverhoudingen (wanneer aan bepaalde voorwaarden is voldaan).
In Unit 4B zullen we zie dat betrouwbaarheidsintervallen nuttig zijn wanneer we gegevens willen gebruiken om een onbekende populatieparameter te schatten, zelfs wanneer deze parameter wordt geschat met behulp van meerdere variabelen (zoals onze cases: CC, CQ, QQ).
Bijvoorbeeld kunnen we betrouwbaarheidsintervallen construeren voor de helling van een regressievergelijking of de correlatiecoëfficiënt. Daarbij gebruiken we altijd onze gegevens om een intervalschatting te geven voor een onbekende populatieparameter (de TRUE-helling of de TRUE-correlatiecoëfficiënt).
Puntschatting
Puntschatting is de vorm van statistische gevolgtrekking waarbij we, op basis van de steekproefgegevens, de onbekende parameter schatten van belang met behulp van een enkele waarde (vandaar de naam puntschatting). Zoals de volgende twee voorbeelden illustreren, is deze vorm van gevolgtrekking vrij intuïtief.
VOORBEELD:
Stel dat we geïnteresseerd zijn in studeren het IQ-niveau van studenten aan Smart University (SU). In het bijzonder (aangezien IQ-niveau een kwantitatieve variabele is), zijn we geïnteresseerd in het schatten van µ (mu), het gemiddelde IQ-niveau van alle studenten bij SU.
Er werd een willekeurige steekproef van 100 SU-studenten gekozen, en hun (steekproef) gemiddelde IQ-niveau bleek 115 (x-bar) te zijn.
Als we µ (mu), het populatiegemiddelde IQ-niveau, wilden schatten door een enkel getal op basis van de steekproef , zou het intuïtief logisch zijn om de overeenkomstige hoeveelheid in de steekproef te gebruiken, het steekproefgemiddelde dat 115 is. We zeggen dat 115 de puntschatting is voor µ (mu), en in het algemeen gebruiken we altijd het steekproefgemiddelde (x -bar) als puntschatter voor µ (mu). (Merk op dat wanneer we het hebben over de specifieke waarde (115), we de term schatting gebruiken, en wanneer we het in het algemeen hebben over de statistische x-balk, we de term schatter gebruiken. De volgende afbeelding vat dit voorbeeld samen:
Hier is nog een voorbeeld.
VOORBEELD:
Stel dat we geïnteresseerd zijn in de mening van Amerikaanse volwassenen over het legaliseren van het gebruik van marihuana. We zijn in het bijzonder geïnteresseerd in de parameter p, het aandeel van Amerikaanse volwassenen die vinden dat marihuana moet worden gelegaliseerd.
Stel dat een opiniepeiling onder 1.000 Amerikaanse volwassenen vindt dat 560 van hen vinden dat marihuana moet worden gelegaliseerd. op de steekproef, zou het intuïtief logisch zijn om de overeenkomstige hoeveelheid in de steekproef te gebruiken, de steekproefverhouding p-hat = 560/1000 = 0,56. In dit geval zeggen we dat 0,56 de puntschatting is voor p, en in het algemeen ‘l Ik gebruik altijd p-hat als puntschatter voor p. (Merk nogmaals op dat wanneer we het hebben over de specifieke waarde (0,56), we de term schatting gebruiken, en wanneer we het in het algemeen hebben over de statistische p-hat, we de term schatter gebruiken. Hier is een visuele samenvatting van dit voorbeeld :
Gewenste eigenschappen van puntschatters
Misschien heb je het gevoel dat je, aangezien het zo intuïtief is, zelf een puntschatting had kunnen maken, zelfs zonder de profiteren van een volledige cursus statistiek.Onze intuïtie zegt ons zeker dat de beste schatter voor het populatiegemiddelde (mu, µ) x-bar zou moeten zijn, en de beste schatter voor de populatie-proportie p p-hat.
Waarschijnlijkheidstheorie doet meer dan dit; het geeft eigenlijk een verklaring (voorbij intuïtie) waarom x-bar en p-hat de goede keuzes zijn als puntschatters voor respectievelijk µ (mu) en p. In het gedeelte Steekproefverdelingen van de kanseenheid leerden we over de steekproefverdeling van x-bar en ontdekten dat zolang een steekproef willekeurig wordt genomen, de verdeling van steekproefgemiddelden precies gecentreerd is op de waarde van het populatiegemiddelde.
Onze statistiek, x-bar, zou daarom een zuivere schatter zijn voor µ (mu). Een bepaald steekproefgemiddelde kan lager blijken te zijn dan het werkelijke populatiegemiddelde, of het zou meer kunnen blijken te zijn. Maar op de lange termijn zijn dergelijke steekproefgemiddelden ‘op schema’ in die zin dat ze niet vaker of minder vaak zullen onderschatten dan ze overschatten.
Evenzo hebben we geleerd dat de steekproefverdeling van de steekproefverhouding, p -hat, is gecentreerd op de populatie-proportie p (zolang de steekproef willekeurig wordt genomen), waardoor p-hat een zuivere schatter is voor p.
Zoals vermeld in de inleiding, speelt waarschijnlijkheidstheorie een essentiële rol bij het vaststellen van resultaten voor statistische inferentie. Onze bewering boven dat steekproefgemiddelde en steekproef proportie zijn onbevooroordeelde schatters is het eerste voorbeeld.
Belang van steekproeven en ontwerp
Merk op hoe belangrijk de principes van steekproeven en ontwerp zijn voor onze bovenstaande resultaten: als de steekproef van Amerikaanse volwassenen in (voorbeeld 2 op de vorige pagina) niet willekeurig was, maar in plaats daarvan voornamelijk studenten omvatte, dan zou 0,56 een vertekende schatting zijn voor p, de proporti een van alle Amerikaanse volwassenen die vinden dat marihuana moet worden gelegaliseerd.
Als het onderzoeksontwerp onjuist was, zoals het laden van de vraag met een herinnering over de gevaren van marihuana die leidt tot harddrugs, of een herinnering aan de voordelen marihuana voor kankerpatiënten, dan zou 0,56 een vertekend beeld geven van respectievelijk de lage of hoge kant.
Standaardfout en steekproefomvang
Niet alleen zijn het gemiddelde van de steekproef en de steekproefverhouding op het doelwit, zolang de steekproeven willekeurig zijn, maar hun precisie verbetert naarmate de steekproefomvang toeneemt.
Nogmaals, er zijn hier twee “lagen” om dit uit te leggen.
Bedenk dat de steekproefverdeling van de steekproefgemiddelde x-staaf, zoals we eerder vermeldden, gecentreerd is op het populatiegemiddelde µ (mu) en een standaardfout heeft (standaarddeviatie van de statistiek, x-bar) van
Als resultaat, als de steekproefomvang n toeneemt, wordt de steekproefverdeling van x-bar minder verspreid. Dit betekent dat waarden van x-bar die zijn gebaseerd op een grotere steekproef waarschijnlijk dichter bij µ (mu) liggen (zoals de onderstaande afbeelding illustreert):
Evenzo, aangezien de steekproefverdeling van p-hat gecentreerd is op p en een
die afneemt naarmate de steekproefomvang groter wordt, zullen de waarden van p-hat waarschijnlijk dichter bij p liggen wanneer de steekproefomvang groter is.
Nog een puntschatter
Een ander voorbeeld van een puntschatter is het gebruik van de standaarddeviatie van een steekproef,
om de standaarddeviatie van de populatie te schatten, σ (sigma).
In deze cursus zullen we ons niet bezighouden met het schatten van de populatiestandaard deviatie omwille van zichzelf, maar aangezien we σ (sigma) vaak zullen vervangen door de standaarddeviatie (s) van het monster bij het standaardiseren van het gemiddelde van het monster, is het de moeite waard erop te wijzen dat s een unbia is sed schatter voor σ (sigma).
Als we hadden gedeeld door n in plaats van n – 1 in onze schatter voor de standaarddeviatie van de populatie, dan zou onze steekproefvariantie op de lange termijn schuldig zijn aan een lichte onderschatting.Deling door n – 1 bereikt het doel om deze puntschatter onbevooroordeeld te maken.
De reden dat onze formule voor s, geïntroduceerd in de Verkennende Data Analyse-eenheid, deling door n – 1 inhoudt in plaats van door n is de feit dat we in de praktijk onbevooroordeelde schatters willen gebruiken.
Laten we samenvatten
- We gebruiken p-hat (steekproefaandeel) als puntschatter voor p (populatie-aandeel). Het is een zuivere schatter: de langetermijnverdeling is gecentreerd op p zolang de steekproef willekeurig is.
- We gebruiken x-bar (steekproefgemiddelde) als puntschatter voor µ (mu, populatiegemiddelde). Het is een zuivere schatter: de langetermijnverdeling is gecentreerd op µ (mu) zolang de steekproef willekeurig is.
- In beide gevallen geldt: hoe groter de steekproefomvang, hoe nauwkeuriger de puntschatter is. Met andere woorden, hoe groter de steekproefomvang, hoe waarschijnlijker het is dat het gemiddelde van de steekproef (proportie) dicht bij het onbekende populatiegemiddelde (proportie) ligt.
Intervalschatting
Puntschatting is eenvoudig en intuïtief, maar ook een beetje problematisch. Dit is waarom:
Wanneer we μ (mu) schatten door de steekproefgemiddelde x-balk, is het bijna zeker dat we een fout maken. Hoewel we weten dat de waarden van x-bar rond μ (mu) vallen, is het zeer onwaarschijnlijk dat de waarde van x-bar precies op μ (mu) valt.
Aangezien dergelijke fouten zijn een feit van het leven voor puntschattingen (door het enkele feit dat we onze schatting baseren op één steekproef die een klein deel van de populatie is), zijn deze schattingen op zichzelf van beperkt nut, tenzij we in staat zijn om de omvang van de schattingsfout. Intervalschatting lost dit probleem op. Het idee achter intervalschatting is daarom om de eenvoudige puntschattingen te verbeteren door informatie te verstrekken over de grootte van de bijgevoegde fout.
In deze inleiding zullen we voorbeelden geven die u een solide intuïtie geven over het basisidee achter intervalschatting.
VOORBEELD:
Beschouw het voorbeeld dat we hebben besproken in de puntschattingssectie:
Stel dat we geïnteresseerd zijn in het bestuderen van de IQ-niveaus van studenten die Smart University (SU) bezoeken. In het bijzonder (aangezien IQ-niveau een kwantitatieve variabele is), zijn we geïnteresseerd in het schatten van μ (mu), het gemiddelde IQ-niveau van alle studenten in SU. Er werd een willekeurige steekproef van 100 SU-studenten gekozen en hun (steekproef) gemiddelde IQ-niveau bleek 115 (x-bar) te zijn.
Bij puntschatting gebruikten we x-bar = 115 als puntschatting voor μ (mu). We hadden echter geen idee wat de schattingsfout bij een dergelijke schatting zou kunnen zijn. Intervalschatting gaat een stap verder en zegt zoiets als:
“Ik ben er voor 95% zeker van dat door de puntschatting x-bar = 115 te gebruiken om μ (mu) te schatten, ik er niet meer naast zit dan 3 IQ-punten. Met andere woorden, ik ben er 95% zeker van dat μ (mu) binnen 3 van 115 ligt, of tussen 112 (115 – 3) en 118 (115 + 3). “
Toch een andere manier om hetzelfde te zeggen is: ik ben er 95% zeker van dat μ (mu) ergens in (of gedekt wordt door) het interval (112,118). (opmerking: op dit punt zou je je geen zorgen moeten maken over, of proberen erachter te komen , hoe we aan deze cijfers zijn gekomen. We zullen dat later doen. Het enige wat we hier willen doen, is ervoor zorgen dat u het idee begrijpt.)
Merk op dat terwijl puntschatting slechts één getal als schatting voor μ (mu) van 115, geeft een intervalschatting een heel interval van “plausibele waarden” voor μ (mu) (tussen 112 en 118), en verbindt ook ons vertrouwen dat dit interval inderdaad de waarde van μ (mu) omvat onze schatting (in ons voorbeeld 95% vertrouwen). Het interval (112,118) wordt daarom ‘een betrouwbaarheidsinterval van 95% voor μ (mu)’ genoemd.
Laten we naar een ander voorbeeld kijken:
VOORBEELD:
Laten we eens kijken naar het tweede voorbeeld uit het puntschattingsgedeelte.
Stel dat we geïnteresseerd zijn in de mening van Amerikaanse volwassenen over het legaliseren van het gebruik van We zijn in het bijzonder geïnteresseerd in de parameter p, het percentage Amerikaanse volwassenen dat vindt dat marihuana gelegaliseerd moet worden.
Stel dat een opiniepeiling onder 1.000 Amerikaanse volwassenen vindt dat 560 van hen vinden dat marihuana moet worden gelegaliseerd.
Als we p, de populatie-proportie, willen schatten met een enkel getal op basis van de steekproef, zou het intuïtief logisch zijn om de overeenkomstige hoeveelheid in de steekproef te gebruiken, de steekproefverhouding p-hat = 560/1000 = 0,56.
Intervalschatting zou dit een stap verder gaan en iets zeggen zoals:
“Ik ben er 90% zeker van dat door 0,56 om de werkelijke populatie-proportie te schatten, p, ik ben vertrokken met (of, ik heb een fout van) niet meer dan 0,03 (of 3 procentpunten). Met andere woorden, ik ben er 90% zeker van dat de werkelijke waarde van p ergens tussen 0 ligt.53 (0,56 – 0,03) en 0,59 (0,56 + 0,03). “
Nog een andere manier om dit te zeggen is:” Ik ben er 90% zeker van dat p wordt gedekt door het interval (0,53, 0,59). ”
In dit voorbeeld is (0,53, 0,59) een 90% betrouwbaarheidsinterval voor p.
Laten we samenvatten
De twee voorbeelden lieten ons zien dat het idee achter intervalschatting is, in plaats van slechts één getal te geven voor het schatten van een onbekende parameter van belang, om een interval van plausibele waarden van de parameter te geven plus een betrouwbaarheidsniveau dat de waarde van de parameter onder dit interval valt. / p>
We gaan nu dieper in op en leren hoe deze betrouwbaarheidsintervallen worden gecreëerd en geïnterpreteerd in de context. Zoals u zult zien, zijn de ideeën die zijn ontwikkeld in het gedeelte ‘Steekproefverdelingen’ van de kanseenheid zal opnieuw erg belangrijk zijn. Bedenk dat voor puntschatting ons begrip van steekproevenverdelingen leidt tot verificatie dat onze statistieken onbevooroordeeld zijn en ons een precieze formule geeft voor de standaardfout van onze statistieken.
We beginnen met het bespreken van betrouwbaarheidsintervallen voor de populatiegemiddelde μ (mu), en bespreek later betrouwbaarheidsintervallen voor het populatie-aandeel p.
Getagd als: CO-4, Schatting, Schatting, Interval Schatting, LO 4.29, Parameter, Puntschatting, Puntschatter, steekproefomvang, steekproef, steekproefverdeling, standaardfout van een statistiek, statistiek, onderzoeksopzet, onbevooroordeeld