- Einführung
- Punktschätzung
- Gewünschte Eigenschaften des Punktes Schätzer
- Bedeutung von Stichprobe und Design
- Standardfehler und Stichprobengröße
- Ein weiterer Punktschätzer (Standardabweichung der Stichprobe)
- Zusammenfassung des Punktes Schätzung
- Einführung in die Intervallschätzung
- Fassen wir zusammen
Einführung
In unserer Einführung in Inferenz wir definierte Punktschätzungen und Inte rval Schätzungen.
- Bei der Punktschätzung schätzen wir einen unbekannten Parameter unter Verwendung einer einzelnen Zahl, die aus den Beispieldaten berechnet wird.
- Im Intervall Schätzung schätzen wir einen unbekannten Parameter unter Verwendung eines Werteintervalls, das wahrscheinlich den wahren Wert dieses Parameters enthält (und geben an, wie sicher wir sind, dass dieses Intervall tatsächlich den wahren Wert des Parameters erfasst).
In diesem Abschnitt werden wir das Konzept eines Konfidenzintervalls vorstellen und lernen, Konfidenzintervalle für Populationsmittelwerte und Populationsanteile zu berechnen (wenn bestimmte Bedingungen erfüllt sind).
In Einheit 4B werden wir Stellen Sie sicher, dass Konfidenzintervalle immer dann nützlich sind, wenn wir Daten zum Schätzen eines unbekannten Populationsparameters verwenden möchten, auch wenn dieser Parameter unter Verwendung mehrerer Variablen geschätzt wird (z. B. in unseren Fällen: CC, CQ, QQ).
Zum Beispiel können wir Konfidenzintervalle für die Steigung einer Regressionsgleichung oder den Korrelationskoeffizienten konstruieren. Dabei verwenden wir unsere Daten immer, um eine Intervallschätzung für einen unbekannten Populationsparameter (die TRUE-Steigung oder den TRUE-Korrelationskoeffizienten) bereitzustellen.
Punktschätzung
Die Punktschätzung ist die Form der statistischen Inferenz, bei der wir basierend auf den Probendaten den unbekannten Parameter schätzen von Interesse unter Verwendung eines einzelnen Wertes (daher die Namenspunktschätzung). Wie die folgenden beiden Beispiele zeigen, ist diese Form der Inferenz sehr intuitiv.
BEISPIEL:
Angenommen, wir möchten studieren die IQ-Werte der Studenten der Smart University (SU). Insbesondere (da das IQ-Niveau eine quantitative Variable ist) sind wir daran interessiert, µ (mu), das mittlere IQ-Niveau aller Studenten an der SU, zu schätzen.
Es wurde eine Zufallsstichprobe von 100 SU-Studenten ausgewählt. und ihr (Stichproben-) mittlerer IQ-Wert wurde zu 115 (x-Balken) bestimmt.
Wenn wir µ (mu), den mittleren IQ-Wert der Population, durch eine einzelne Zahl basierend auf der Stichprobe schätzen wollten Es wäre intuitiv sinnvoll, die entsprechende Menge in der Stichprobe zu verwenden, den Stichprobenmittelwert von 115. Wir sagen, dass 115 die Punktschätzung für µ (mu) ist, und im Allgemeinen verwenden wir immer den Stichprobenmittelwert (x) -bar) als Punktschätzer für µ (mu). (Beachten Sie, dass wir, wenn wir über den spezifischen Wert (115) sprechen, den Begriff Schätzung verwenden und wenn wir allgemein über den statistischen x-Balken sprechen, den Begriff Schätzer verwenden. Die folgende Abbildung fasst dieses Beispiel zusammen:
Hier ist ein weiteres Beispiel.
BEISPIEL:
Angenommen, wir interessieren uns für die Meinungen von Erwachsenen in den USA zur Legalisierung des Marihuanakonsums. Insbesondere interessieren wir uns für den Parameter p, den Anteil von US-Erwachsene, die glauben, Marihuana sollte legalisiert werden.
Angenommen, eine Umfrage unter 1.000 US-Erwachsenen ergab, dass 560 von ihnen glauben, Marihuana sollte legalisiert werden. Wenn wir p schätzen wollten, basiert der Bevölkerungsanteil auf einer einzigen Zahl Für die Stichprobe wäre es intuitiv sinnvoll, die entsprechende Menge in der Stichprobe zu verwenden, den Stichprobenanteil p-hat = 560/1000 = 0,56. In diesem Fall sagen wir, dass 0,56 die Punktschätzung für p ist, und im Allgemeinen für uns ‚l Ich benutze immer p-hat als Punktschätzer für p. (Beachten Sie erneut, dass wir, wenn wir über den spezifischen Wert (0,56) sprechen, den Begriff Schätzung verwenden, und wenn wir allgemein über die Statistik p-hat sprechen, den Begriff Schätzer verwenden. Hier ist eine visuelle Zusammenfassung dieses Beispiels :
Gewünschte Eigenschaften von Punktschätzern
Sie könnten das Gefühl haben, dass Sie, da dies so intuitiv ist, die Punktschätzung auch ohne die selbst herausfinden könnten Nutzen eines ganzen Kurses in Statistik.Unsere Intuition sagt uns sicherlich, dass der beste Schätzer für den Populationsmittelwert (mu, µ) x-bar sein sollte und der beste Schätzer für den Populationsanteil p p-hat sein sollte.
Die Wahrscheinlichkeitstheorie leistet mehr als das; es gibt tatsächlich eine Erklärung (jenseits der Intuition), warum x-bar und p-hat die gute Wahl als Punktschätzer für µ (mu) bzw. p sind. Im Abschnitt Stichprobenverteilungen der Wahrscheinlichkeitseinheit haben wir die Stichprobenverteilung von x-bar kennengelernt und festgestellt, dass die Verteilung der Stichprobenmittel genau auf den Wert des Populationsmittelwerts zentriert ist, solange eine Stichprobe zufällig entnommen wird.
Unsere Statistik x-bar wird daher als unverzerrter Schätzer für µ bezeichnet (mu). Ein bestimmter Stichprobenmittelwert kann sich als geringer als der tatsächliche Bevölkerungsdurchschnitt herausstellen, oder er kann sich als höher herausstellen. Auf lange Sicht sind solche Stichprobenmittel jedoch „im Ziel“, da sie nicht mehr oder weniger häufig unterschätzen als überschätzen.
Ebenso haben wir erfahren, dass die Stichprobenverteilung des Stichprobenanteils p -hat ist auf den Bevölkerungsanteil p zentriert (solange die Stichprobe zufällig entnommen wird), wodurch p-hat ein unvoreingenommener Schätzer für p wird.
Wie in der Einleitung angegeben, spielt die Wahrscheinlichkeitstheorie eine wesentliche Rolle, wenn wir Ergebnisse für statistische Inferenz erstellen. Unsere Behauptung über diesem Stichprobenmittelwert und dieser Stichprobe Anteil sind unvoreingenommene Schätzer ist der erste derartige Fall.
Bedeutung von Stichproben und Design
Beachten Sie, wie wichtig die Prinzipien von Stichproben und Design für unsere obigen Ergebnisse sind: wenn die Stichprobe von Erwachsenen in den USA in (Beispiel 2 auf der vorherigen Seite) war nicht zufällig, sondern umfasste überwiegend College-Studenten, dann wäre 0,56 eine voreingenommene Schätzung für p, das Verhältnis einer aller Erwachsenen in den USA, die glauben, dass Marihuana legalisiert werden sollte.
Wenn das Umfragedesign fehlerhaft war, z. B. das Laden der Frage mit einer Erinnerung an die Gefahren von Marihuana, die zu harten Drogen führen, oder eine Erinnerung an die Vorteile von Marihuana für Krebspatienten wären dann 0,56 auf der niedrigen bzw. hohen Seite voreingenommen.
Standardfehler und Stichprobengröße
Der Stichprobenmittelwert und der Stichprobenanteil liegen nicht nur auf dem Ziel, solange die Stichproben zufällig sind, sondern ihre Genauigkeit verbessert sich mit zunehmender Stichprobengröße.
Auch hier gibt es zwei „Ebenen“, um dies zu erklären.
Wir erinnern uns, dass die Stichprobenverteilung des Stichprobenmittelwerts x-bar, wie bereits erwähnt, auf dem Populationsmittelwert µ (mu) zentriert ist und einen Standardfehler aufweist (Standardabweichung von Statistik, x-Balken) von
Als Stichprobengröße Wenn n zunimmt, wird die Stichprobenverteilung von x-bar weniger verteilt. Dies bedeutet, dass Werte von x-bar, die auf einer größeren Stichprobe basieren, eher näher an µ (mu) liegen (wie die folgende Abbildung zeigt):
In ähnlicher Weise ist die Stichprobenverteilung von p-hat auf p zentriert und hat eine
, das mit zunehmender Stichprobengröße abnimmt, Werte von p-hat sind eher näher an p, wenn die Stichprobengröße größer ist.
Ein weiterer Punktschätzer
Ein weiteres Beispiel für einen Punktschätzer ist die Verwendung der Standardabweichung der Stichprobe,
zur Schätzung der Populationsstandardabweichung σ (Sigma).
In diesem Kurs werden wir uns nicht mit der Schätzung des Populationsstandards befassen Abweichung um ihrer selbst willen, aber da wir bei der Standardisierung des Stichprobenmittelwerts häufig σ (Sigma) durch die Standardabweichung (en) der Stichprobe ersetzen, ist darauf hinzuweisen, dass s eine Unbestätigung ist sed-Schätzer für σ (Sigma).
Wenn wir in unserem Schätzer für die Populationsstandardabweichung durch n anstelle von n – 1 geteilt hätten, wäre unsere Stichprobenvarianz auf lange Sicht einer leichten Unterschätzung schuldig.Die Division durch n – 1 erreicht das Ziel, diesen Punktschätzer unvoreingenommen zu machen.
Der Grund dafür, dass unsere in der Einheit Exploratory Data Analysis eingeführte Formel für s die Division durch n – 1 anstelle von n beinhaltet, ist die Tatsache, dass wir in der Praxis unverzerrte Schätzer verwenden möchten.
Fassen wir zusammen
- Wir verwenden p-hat (Stichprobenanteil) als Punktschätzer für p (Bevölkerungsanteil). Es ist ein unvoreingenommener Schätzer: Seine langfristige Verteilung ist auf p zentriert, solange die Stichprobe zufällig ist.
- Wir verwenden x-bar (Stichprobenmittelwert) als Punktschätzer für µ (mu, Populationsmittelwert). Es ist ein unvoreingenommener Schätzer: Seine langfristige Verteilung ist auf µ (mu) zentriert, solange die Stichprobe zufällig ist.
- In beiden Fällen ist die Stichprobengröße umso größer. Je genauer der Punktschätzer ist. Mit anderen Worten, je größer die Stichprobengröße ist, desto wahrscheinlicher ist es, dass der Stichprobenmittelwert (Anteil) nahe am unbekannten Populationsmittelwert (Anteil) liegt.
Intervallschätzung
Die Punktschätzung ist einfach und intuitiv, aber auch etwas problematisch. Hier ist der Grund:
Wenn wir μ (mu) anhand des mittleren x-Balkens der Stichprobe schätzen, ist fast garantiert, dass wir einen Fehler machen. Obwohl wir wissen, dass die Werte von x-bar um μ (mu) fallen, ist es sehr unwahrscheinlich, dass der Wert von x-bar genau bei μ (mu) fällt.
Angesichts solcher Fehler Diese Tatsache ist eine Tatsache des Lebens für Punktschätzungen (allein aufgrund der Tatsache, dass wir unsere Schätzung auf eine Stichprobe stützen, die einen kleinen Teil der Bevölkerung ausmacht). Diese Schätzungen sind an sich nur von begrenztem Nutzen, es sei denn, wir können das Ausmaß der Schätzung quantifizieren Schätzfehler. Die Intervallschätzung behebt dieses Problem. Die Idee hinter der Intervallschätzung besteht daher darin, die einfachen Punktschätzungen zu verbessern, indem Informationen über die Größe des angehängten Fehlers bereitgestellt werden.
In dieser Einführung werden Beispiele aufgeführt, die Ihnen eine solide Vorstellung davon vermitteln Die Grundidee der Intervallschätzung.
BEISPIEL:
Betrachten Sie das Beispiel, das wir im Abschnitt Punktschätzung besprochen haben:
Angenommen, wir möchten die IQ-Werte von Studenten untersuchen, die die Smart University (SU) besuchen. Insbesondere (da das IQ-Niveau eine quantitative Variable ist) sind wir daran interessiert, μ (mu), das mittlere IQ-Niveau aller Schüler in SU, zu schätzen. Eine Zufallsstichprobe von 100 SU-Studenten wurde ausgewählt, und ihr (Stichproben-) mittlerer IQ-Wert betrug 115 (x-Balken).
Bei der Punktschätzung haben wir x-bar = 115 als Punktschätzung für μ (mu) verwendet. Wir hatten jedoch keine Ahnung, wie hoch der Schätzfehler bei einer solchen Schätzung sein könnte. Die Intervallschätzung geht noch einen Schritt weiter und sagt etwas wie:
„Ich bin zu 95% sicher, dass ich durch die Verwendung der Punktschätzung x-bar = 115 zur Schätzung von μ (mu) nicht mehr abwesend bin Mit anderen Worten, ich bin zu 95% sicher, dass μ (mu) innerhalb von 3 von 115 oder zwischen 112 (115 – 3) und 118 (115 + 3) liegt. “
Dennoch Eine andere Möglichkeit, dasselbe zu sagen, ist: Ich bin zu 95% davon überzeugt, dass μ (mu) irgendwo im Intervall (112, 118) liegt (oder von diesem abgedeckt wird). (Kommentar: An dieser Stelle sollten Sie sich keine Sorgen machen oder versuchen, es herauszufinden Wir werden das später tun. Wir möchten hier nur sicherstellen, dass Sie die Idee verstehen.)
Beachten Sie, dass die Punktschätzung nur eine Zahl als Schätzung für μ lieferte (mu) von 115 liefert die Intervallschätzung ein ganzes Intervall von „plausiblen Werten“ für μ (mu) (zwischen 112 und 118) und fügt auch das Maß an Vertrauen hinzu, dass dieses Intervall tatsächlich den Wert von μ (mu) enthält unsere Schätzung (in unserem Beispiel 95% Vertrauen). Das Intervall (112, 118) wird daher als „95% -Konfidenzintervall für μ (mu)“ bezeichnet.
Schauen wir uns ein anderes Beispiel an:
BEISPIEL:
Betrachten wir das zweite Beispiel aus dem Punktschätzungsabschnitt.
Angenommen, wir interessieren uns für die Meinungen von Erwachsenen in den USA zur Legalisierung der Verwendung von Marihuana. Insbesondere interessiert uns der Parameter p, der Anteil der US-Erwachsenen, die glauben, dass Marihuana legalisiert werden sollte.
Angenommen, eine Umfrage unter 1.000 US-Erwachsenen ergab, dass 560 von ihnen glauben, Marihuana sollte legalisiert werden.
Wenn wir p, den Bevölkerungsanteil, durch eine einzelne Zahl schätzen wollten Basierend auf der Stichprobe wäre es intuitiv sinnvoll, die entsprechende Menge in der Stichprobe zu verwenden, den Stichprobenanteil p-hat = 560/1000 = 0,56.
Die Intervallschätzung würde dies einen Schritt weiter gehen und etwas sagen wie:
„Ich bin zu 90% davon überzeugt, dass mit 0,56, um den wahren Bevölkerungsanteil zu schätzen, p, ich bin um nicht mehr als 0,03 (oder 3 Prozentpunkte) (oder ich habe einen Fehler von). Mit anderen Worten, ich bin zu 90% sicher, dass der tatsächliche Wert von p irgendwo zwischen 0 liegt.53 (0,56 – 0,03) und 0,59 (0,56 + 0,03). „
Eine andere Art, dies zu sagen, lautet:“ Ich bin zu 90% sicher, dass p durch das Intervall (0,53, 0,59) abgedeckt ist. “
In diesem Beispiel ist (0,53, 0,59) ein 90% -Konfidenzintervall für p.
Fassen wir
zusammen. Die beiden Beispiele haben uns gezeigt dass die Idee hinter der Intervallschätzung darin besteht, anstatt nur eine Zahl zum Schätzen eines unbekannten interessierenden Parameters bereitzustellen, ein Intervall plausibler Werte des Parameters plus ein Vertrauensniveau bereitzustellen, dass der Wert des Parameters von diesem Intervall abgedeckt wird / p>
Wir werden nun genauer darauf eingehen und lernen, wie diese Konfidenzintervalle im Kontext erstellt und interpretiert werden. Wie Sie sehen werden, wurden die Ideen im Abschnitt „Stichprobenverteilungen“ der Wahrscheinlichkeitseinheit entwickelt wird wieder sehr wichtig sein. Denken Sie daran, dass unser Verständnis der Stichprobenverteilungen für die Punktschätzung zur Überprüfung führt, dass unsere Statistiken unvoreingenommen sind, und uns genaue Formeln für den Standardfehler unserer Statistiken liefert.
Wir beginnen mit der Erörterung der Konfidenzintervalle für die Populationsmittel μ (mu) und diskutieren später Konfidenzintervalle für den Populationsanteil p.
Markiert als: CO-4, Schätzung, Schätzer, Intervallschätzung, LO 4,29, Parameter, Punktschätzung, Punktschätzer, Stichprobengröße, Stichprobe, Stichprobenverteilung, Standardfehler einer Statistik, Statistik, Studiendesign, unvoreingenommen