Greife auf kostenlose Karteikarten, Zusammenfassungen, Übungsaufgaben und Altklausuren für deinen Stichprobentheorie Kurs an der Universität Bielefeld zu.
Nenne fünf entscheidende Konzepte der Stichprobentheorie
Warum ist es sinnvoll eine Stichprobe zu ziehen?
Warum verwendet man modellbasierte Stichproben?
Varianzreduktion des Schätzers mit Hilfe von Sekundärinformationen
Welche Schätzer für modellbasierte Stichproben kennt ihr?
Warum verwendet man designbasierte Stichproben?
Erhöhung der Auswahlwahrscheinlichkeit von Elementen mit höherer Informationsdichte
Welche Schätzer kennt ihr bei designbasierten Stichproben?
Was ist eine größenproportionale Stichprobe?
Auswahrscheinlichkeit proportional zur Größe der Sekundarinformation
Kategorien von Missings
Mit welcher Technik könnte man herausfinden wie viele Besucher einer bestimmten Kneipe schon fremd gegangen sind?
Randomized Response Technik
Je mehr show, desto bessere Antworten
Welche Fehler können beim Messen passiern?
was ist ein experimentelles Design?
arbeitseffiziente Methodik zur systematischen Erstellung von Versuchsplänen, deren Abarbeitung und quantitativen Auswertung mit dem Ziel:
--> Planung der Datenerhebung und deren (statistische) Auswertung
Warum "experimentelles Design"?
--> Verhindert Treibsand-Wissenschaft
Greife kostenlos auf tausende geteilte Karteikarten, Zusammenfassungen, Altklausuren und mehr zu.
Jetzt loslegenWas ist eine Stichprobe?
- Beobachtungsstudie 'Observe but dont disturb'
Welche Forderungen werden an eine Stichprobe gestellt?
- Zielkonform statistisch solide, gerne reproduzierbar
Warum nutze ich Stichproben?
- keine Vollerhebung sinnvoll
Was mache ich mit einer Stichprobe?
- Parameterbestimmung
Wie berechne ich den benötigten Umfang einer Stichprobe?
Fachtermini
Stichproben sind abhängig vom Setting (Fragestellung, GG,...)
Verschiedene Designansätze (einfach, modellbasiert, designbasiert, zerlegt, merhrstufig / -phasig)
Stolperfallen (die nicht immer vermeidbar sind)
Mittelwert- und Varianzschätzer, ggf. KI
experimentelles Design
Was ist experimentelles Design
Wie unterscheiden sich Stichproben und Experiment?
Warum nutzen wir experimentelles Design
Was sind die drei Schritte, die ich im Vorfeld beachten muss?
- kenne dein System, grenze es ab und beschreib es statistisch
Was kann ich bei meinem DOE kontrollieren? und wie?
Warum will ich, dass meine Daten reproduzierbar sind?
Wie gehe ich mit Datenschutz um und wie gewährleiste ich eine gewisse Datenqualität?
Was ist gemeint, wenn wir von wissenschaftlicher Verantwortung sprechen?
Zweiphasiger Quotientenschätzer
- Erster Term bezieht sich auf erste Phase zweiter Term bezieht sich auf Grundgesamtheit
- Damit lässt sich jede beliebige Kombination erreichen
Schichtenstichprobe GG unbekannt => Zweiphasige Stichprobe (->Schichtschätzer)
Wenn Nonresponder an das Ausfüllen des Fragebogens erinnert werden, fällt diese Stichprobe in die Kategorie zweiphasige Stichprobe. Nicht zwingend at random!
Capture Recapature verfahren
- Größe der Stichprobe bestimmen
- Bsp. Mantarochen in Polynesien
- Gefangene / Markierte in zweiten Fang / * Gesamt Markierte im ersten Fang
*Standorttreue Vorrausgesetzt = Migrationsproblem + Tod => approximativ
Mehrphasig: Annahme: GG hat keine weiteren Strukturen und wir erheben nicht zwingend unsere Primärinformation
Räumliche Stichproben
abhängigkeiten enthalten, die nicht unbedingt gewollt sind (bspw. Bibel Belt) Wenn man die Merkmale kennt, kann eine designbasierte Stichprobe helfen.
Missing values
Führt meist zu Systemtischen Fehler
- Unit-Non-Response
- Item-Non-Response
Mögliche Strategien:
(partielle) Imputation, paar-/listenweiser Ausschluss, Interpolation, EM-Algorithmus
Oder werden in Analysen einfach ignoriert
politische Fragen typisch für MNAR
'Sind sie zufrieden mit Bundeskanzlerin Angela Merkel' könnte ein politisches statement sein: 'Ist nicht miene Bundeskanzlerin' =Reichsbürger
Messfehler
Maschine / Gerät gewechselt
Aber systematische Fehler - unterschiede könnte man rausrechnen.
Was ist ein Experiment?
- Interventionsstudien
- Forschungsfrage zum wiederlegen / beweisen
- kontrolliertes System + Manipulation von Parameter(n)
was ist ein experimentelles Design?
arbeitseffiziente Methodik zur systematischen Erstellung von Versuchsplänen, deren Abarbeitung und quantitativen Auswertung mit dem Ziel der Modellierung und / oder Ermittlung relevanter Einflussgrößen und / oder der gewünschten Optimierung der Zielgrößen (maximal, minimal, innerhalb einer bestimmten Bandbreite, robust gegen Störeinflüsse, ...): Y=f(x1,...,xn) bezüglich der Funktionsweise eines Produktes oder Prozesses.
--> Planung der Datenerhebung und deren (statistische) Auswertung
Warum "experimentelles Design"?
Grenzfälle der Konvetion umgehen (p ~ 0,05)
Scheitern meist zu teuer - gut geplant ist halb gewonnen
Zusammenhänge von Input und Output sind (statistisch) abgesichert
Effekte sind quantifizierbar (und im besten Fall auch reproduzierbar)
--> Verhindert Treibsand-Wissenschaft
Mögliche Ebenen:
Längsschnittstudie bspw. nach Alter: 18-85 jährige Studie jährlich oä.
Querschnittstudie bspw. nach Alter: 18J Beobachtung der nächsten 60 Jahren
Case Control
Cross-over
trial and error - Veränderung vieler Faktoren zur selben Zeit
One factor at a time - Veränderung nur eines Faktors pro Zeit
Besser
Teil-/Vollfaktorielle Versuchsplanung - Durchlaufen von allen ("Voll"-") oder zumindest den Faktorkombinationen, die von Interesse sind ("Teil")
Erster Schritt: Kenne dein System!
Eingang
sgrößen, die gezielt verändert werden können --> System --> Ergebnisse
Eingangsgrößen, die nicht gezielt verändert werden können oder unbekannt sind.
Vorrausssetzung: Interdisziplinarität! (Kein Elfenbeinturm-denken)
Zweiter Schritt: Abgrenzung
was ist realistisch, machbar und möglich? - unpassender Versuchsplan / Notwendige Abweichung (Gerät kaputt, Kombination nicht realisierbar) - Fehler in der Durchführung
Extreme Vortests machen nicht immer Sinn oder nihct immer gut (Explosionsgefahr ;D)
durch ersten Schritt bessere Abgrenzung möglich
Einfacher Weg: Parameterliste
Versuchsraum nicht verlassen!!!!!
Sind die Faktoren "reproduzierbar?
Ist der Aufwand gerechtfertigt?
Welche Stufen sind realistisch?
Dritter Schritt: Modellbeschreibung
PPS: Problem pi ist Zufallsvariable, die von Kovariate abhängig - wird gelöst
Lösung: Sekundärinformation (Domänenwissen)
n soll fest sein
Samford - Verwerfungsstichprobe
Tillé - Eliminierungsmethode
rki Eliminierungswkeit
Midzuno / splitting "Teile und Herrsche" relativ große SP
zwei ziehungsstrategien (Eine darf auch nochmal Midzuno sein)
Madow relativ kleine Stichprobe
- Sekundärinformation ganzzahlig. Komplizierte Auswahl von k-tem Element Aus Zufallszahl und Grenze über SekInfo
Hansen-Hurwitz-Strategie
approximative Lösung von Horwitz-Thompson
mit zurücklegen wird zugelassen
Numerisch (sogar analytisch) lösbar
Wann einfache SP?
Keep it short and simple!
Wenn Xi < 0 => pi_i < 0
Wann PPS-SP?
Streuung Yi > Streuung Yi/Xi. Also wenn es einflussnehmende Kovariaten gibt
Datenqualität durch Merkmalsträger verschlechetern
Denkende Forscher
Fehlende Standards
falsche Datenerhebung
Sicherheitskopie / version control
fehlende Objektivität
fehlende Plausibilitätsanalyse
Zuverlässigkeit der Daten: Je geringer der zufällige Fehler, umso größer die Zuverlässigkeit
Messwert = Realität + systematischer Fehler + zufälliger Fehler
=> Messwiederholung / Reproduzierbarkeit
Melde dich kostenlos an und bekomme Zugang zu der kompletten Zusammenfassung und tausenden Karteikarten!
Für deinen Studiengang Stichprobentheorie an der Universität Bielefeld gibt es bereits viele Kurse, die von deinen Kommilitonen auf StudySmarter erstellt wurden. Karteikarten, Zusammenfassungen, Altklausuren, Übungsaufgaben und mehr warten auf dich!