Statistik at Universität Jena | Flashcards & Summaries

Select your language

Suggested languages for you:
Log In Start studying!

Lernmaterialien für Statistik an der Universität Jena

Greife auf kostenlose Karteikarten, Zusammenfassungen, Übungsaufgaben und Altklausuren für deinen Statistik Kurs an der Universität Jena zu.

TESTE DEIN WISSEN

Was ist Extraktion?

Lösung anzeigen
TESTE DEIN WISSEN

Mit möglichst wenigen Faktoren möglichst viel Varianz aufklären
Ziel: Einfache Struktur

Lösung ausblenden
TESTE DEIN WISSEN

Welche Eigenschaften hat das Residuum?

Lösung anzeigen
TESTE DEIN WISSEN

• E(ε) = 0.
• E(ε | X) = 0.
• E(ε | f(X)) = 0.
• Cov(ε,X) = 0 , falls X numerisch ist.

Lösung ausblenden
TESTE DEIN WISSEN

Wie berechnet man den VIF?

Lösung anzeigen
TESTE DEIN WISSEN

VIF = 1/1-R2

Lösung ausblenden
TESTE DEIN WISSEN

Was ist die Uniqueness uj einer Variablen Xj?

Lösung anzeigen
TESTE DEIN WISSEN

• Der Variablen eigener, einmaliger Varianzanteil, der nicht durch Faktoren des Modells erklärt wird
• Zusammengesetzt aus spezifischen, systematischen Varianzanteil der Variablen und Messfehler der Variablen
• Bei standardisierten Variablen = 1 - Kommunalität

Lösung ausblenden
TESTE DEIN WISSEN

Was sind Faktorscores/ Faktorwerte?

Lösung anzeigen
TESTE DEIN WISSEN

• Ausprägungen der Personen auf den standardisierten Hauptkomponenten
• Berechnung mit Hilfe von Gewichtungsfaktoren und Eigenwerten

Lösung ausblenden
TESTE DEIN WISSEN

Wie wird das Residuum definiert?

Lösung anzeigen
TESTE DEIN WISSEN

Das Residuum ε bezüglich einer Regression E(Y | X) ist definiert als Abweichung der Zufallsvariablen Y von ihrer
Regression E(Y|X) auf X.
In Formeln: ε = Y − E(Y | X)
Daraus folgt auch: Y = E(Y | X) + ε

Lösung ausblenden
TESTE DEIN WISSEN

Was ist die Rotation zur Einfachstruktur?

Lösung anzeigen
TESTE DEIN WISSEN

Nach der Festlegung der Anzahl von relevanten Faktoren wird eine erneute Rotation der Hauptkomponenten
durchgeführt.
Ziel: Herstellen einer interpretierbaren Einfachstruktur
• „simple structure“ (Thurstone, 1947) besagt, dass die Ausgangsvariablen möglichst hoch auf einen, aber
niedrig auf den anderen Hauptkomponenten laden
• Mathematisch: die Varianz der Ladungen pro Hauptkomponente soll maximiert werden → sog. Varimax-
Rotation
• Die varimaxrotierten Hauptkomponenten sind ebenfalls orthogonal zueinander.
• Vorteil: einfache Struktur

Lösung ausblenden
TESTE DEIN WISSEN

3. Modellbasierte Ansätze

Was ist die Maximum Likelihood Methode?

Lösung anzeigen
TESTE DEIN WISSEN

Maximum Likelihood Methoden
Synonyme: Full-information maximum likelihood (FIML, im Rahmen von Strukturgleichungsmodellierung)
Vorgehen:
Keine Imputation auf Personenebene, stattdessen lediglich Schätzung der interessierenden
Populationsparameter (z.B. Varianzen und Kovarianzen) und ihrer Standardfehler auf Basis der beobachteten Daten
Missing Data Handling und Parameterschätzung in einem Schritt kombiniert durch Schätzung
der Likelihood, für die gilt: P(observed data|parameter estimates)
= maximal
Annahme: Fehlende Werte sind missing at random (MAR)
Vorteile:
Unverzerrte Parameterschätzungen bei Gültigkeit der Annahmen
Große Flexibilität, da viele verschiedene Modelle verwendet werden können
Nachteile:
Hilfsvariablen üblicherweise nicht berücksichtigt

Lösung ausblenden
TESTE DEIN WISSEN

Wie kann man die Faktorladung ajk interpretieren?

Lösung anzeigen
TESTE DEIN WISSEN

• Relativer Beitrag der k-ten Hauptkomponente zur Vorhersage der Ausprägung Items j (vgl. multiple Regression)
• Entspricht Korrelation der Variablen Xj mit Hauptkomponente k bei Unkorreliertheit der Hauptkomponenten
(vgl. multiple Regression mit unkorrelierten Prädiktoren)

Lösung ausblenden
TESTE DEIN WISSEN

1. Datenbasierte Ansätze: Was ist die Available Case Analysis?

Lösung anzeigen
TESTE DEIN WISSEN

Synonyme: Pairwise deletion
Vorgehen:
Nur Fälle mit Werten auf jeweils genutzten Variablen in Analysen einbezogen;
Maximum an verfügbaren Daten einer jeden Berechnung zugrunde gelegt
Annahme: Fehlende Werte sind missing completely at random (MCAR)
Vorteile:
Einfache Anwendung
Nutzung aller verfügbaren Daten
Bei fehlenden Werten, die vollständig zufällig sind, resultieren unverfälschte Schätzungen
Nachteile: Verzerrte Schätzungen bei systematischen (nicht MCAR) Missings
Voraussetzung für Anwendung vieler multivariater Verfahren evtl. nicht erfüllt
Zugrundeliegende Stichprobengröße für multivariate Verfahren oft unklar

Lösung ausblenden
TESTE DEIN WISSEN

2. Imputationsbasierte Ansätze

Was ist die Single Imputation?

Lösung anzeigen
TESTE DEIN WISSEN

Vorgehen: Fehlende Werte im Datensatz werden mit Hilfe verschiedener Verfahren ersetzt, z.B. (bedingter)
Mittelwert der Variable (mean imputation) oder der vorhergesagten Werte einer Regression
(regression imputation)
Annahme: Fehlende Werte sind missing completely at random (MCAR)
Vorteile:
s. Folie 35
Nachteile: Verzerrte Schätzungen bei systematischen (nicht MCAR) Missings
Unterschätzung der Standardfehler und Überschätzung der Teststatistiken, da imputierte Daten
als reale Daten behandelt werden
Schwierig in multivariaten Settings zu implementieren
Generell wird der Einsatz dieser Verfahren nicht empfohlen 

Lösung ausblenden
TESTE DEIN WISSEN

Wie kann man die Faktorscores Fjk interpretieren?

Lösung anzeigen
TESTE DEIN WISSEN

• Ausprägung der Person i auf dem konstruierten Merkmal, welches durch die Hauptkomponente k beschrieben
ist

Lösung ausblenden
  • 128336 Karteikarten
  • 2204 Studierende
  • 95 Lernmaterialien

Beispielhafte Karteikarten für deinen Statistik Kurs an der Universität Jena - von Kommilitonen auf StudySmarter erstellt!

Q:

Was ist Extraktion?

A:

Mit möglichst wenigen Faktoren möglichst viel Varianz aufklären
Ziel: Einfache Struktur

Q:

Welche Eigenschaften hat das Residuum?

A:

• E(ε) = 0.
• E(ε | X) = 0.
• E(ε | f(X)) = 0.
• Cov(ε,X) = 0 , falls X numerisch ist.

Q:

Wie berechnet man den VIF?

A:

VIF = 1/1-R2

Q:

Was ist die Uniqueness uj einer Variablen Xj?

A:

• Der Variablen eigener, einmaliger Varianzanteil, der nicht durch Faktoren des Modells erklärt wird
• Zusammengesetzt aus spezifischen, systematischen Varianzanteil der Variablen und Messfehler der Variablen
• Bei standardisierten Variablen = 1 - Kommunalität

Q:

Was sind Faktorscores/ Faktorwerte?

A:

• Ausprägungen der Personen auf den standardisierten Hauptkomponenten
• Berechnung mit Hilfe von Gewichtungsfaktoren und Eigenwerten

Mehr Karteikarten anzeigen
Q:

Wie wird das Residuum definiert?

A:

Das Residuum ε bezüglich einer Regression E(Y | X) ist definiert als Abweichung der Zufallsvariablen Y von ihrer
Regression E(Y|X) auf X.
In Formeln: ε = Y − E(Y | X)
Daraus folgt auch: Y = E(Y | X) + ε

Q:

Was ist die Rotation zur Einfachstruktur?

A:

Nach der Festlegung der Anzahl von relevanten Faktoren wird eine erneute Rotation der Hauptkomponenten
durchgeführt.
Ziel: Herstellen einer interpretierbaren Einfachstruktur
• „simple structure“ (Thurstone, 1947) besagt, dass die Ausgangsvariablen möglichst hoch auf einen, aber
niedrig auf den anderen Hauptkomponenten laden
• Mathematisch: die Varianz der Ladungen pro Hauptkomponente soll maximiert werden → sog. Varimax-
Rotation
• Die varimaxrotierten Hauptkomponenten sind ebenfalls orthogonal zueinander.
• Vorteil: einfache Struktur

Q:

3. Modellbasierte Ansätze

Was ist die Maximum Likelihood Methode?

A:

Maximum Likelihood Methoden
Synonyme: Full-information maximum likelihood (FIML, im Rahmen von Strukturgleichungsmodellierung)
Vorgehen:
Keine Imputation auf Personenebene, stattdessen lediglich Schätzung der interessierenden
Populationsparameter (z.B. Varianzen und Kovarianzen) und ihrer Standardfehler auf Basis der beobachteten Daten
Missing Data Handling und Parameterschätzung in einem Schritt kombiniert durch Schätzung
der Likelihood, für die gilt: P(observed data|parameter estimates)
= maximal
Annahme: Fehlende Werte sind missing at random (MAR)
Vorteile:
Unverzerrte Parameterschätzungen bei Gültigkeit der Annahmen
Große Flexibilität, da viele verschiedene Modelle verwendet werden können
Nachteile:
Hilfsvariablen üblicherweise nicht berücksichtigt

Q:

Wie kann man die Faktorladung ajk interpretieren?

A:

• Relativer Beitrag der k-ten Hauptkomponente zur Vorhersage der Ausprägung Items j (vgl. multiple Regression)
• Entspricht Korrelation der Variablen Xj mit Hauptkomponente k bei Unkorreliertheit der Hauptkomponenten
(vgl. multiple Regression mit unkorrelierten Prädiktoren)

Q:

1. Datenbasierte Ansätze: Was ist die Available Case Analysis?

A:

Synonyme: Pairwise deletion
Vorgehen:
Nur Fälle mit Werten auf jeweils genutzten Variablen in Analysen einbezogen;
Maximum an verfügbaren Daten einer jeden Berechnung zugrunde gelegt
Annahme: Fehlende Werte sind missing completely at random (MCAR)
Vorteile:
Einfache Anwendung
Nutzung aller verfügbaren Daten
Bei fehlenden Werten, die vollständig zufällig sind, resultieren unverfälschte Schätzungen
Nachteile: Verzerrte Schätzungen bei systematischen (nicht MCAR) Missings
Voraussetzung für Anwendung vieler multivariater Verfahren evtl. nicht erfüllt
Zugrundeliegende Stichprobengröße für multivariate Verfahren oft unklar

Q:

2. Imputationsbasierte Ansätze

Was ist die Single Imputation?

A:

Vorgehen: Fehlende Werte im Datensatz werden mit Hilfe verschiedener Verfahren ersetzt, z.B. (bedingter)
Mittelwert der Variable (mean imputation) oder der vorhergesagten Werte einer Regression
(regression imputation)
Annahme: Fehlende Werte sind missing completely at random (MCAR)
Vorteile:
s. Folie 35
Nachteile: Verzerrte Schätzungen bei systematischen (nicht MCAR) Missings
Unterschätzung der Standardfehler und Überschätzung der Teststatistiken, da imputierte Daten
als reale Daten behandelt werden
Schwierig in multivariaten Settings zu implementieren
Generell wird der Einsatz dieser Verfahren nicht empfohlen 

Q:

Wie kann man die Faktorscores Fjk interpretieren?

A:

• Ausprägung der Person i auf dem konstruierten Merkmal, welches durch die Hauptkomponente k beschrieben
ist

Statistik

Erstelle und finde Lernmaterialien auf StudySmarter.

Greife kostenlos auf tausende geteilte Karteikarten, Zusammenfassungen, Altklausuren und mehr zu.

Jetzt loslegen

Das sind die beliebtesten StudySmarter Kurse für deinen Studiengang Statistik an der Universität Jena

Für deinen Studiengang Statistik an der Universität Jena gibt es bereits viele Kurse, die von deinen Kommilitonen auf StudySmarter erstellt wurden. Karteikarten, Zusammenfassungen, Altklausuren, Übungsaufgaben und mehr warten auf dich!

Mehr Karteikarten anzeigen

Das sind die beliebtesten Statistik Kurse im gesamten StudySmarter Universum

Statistik

Universität Koblenz-Landau

Zum Kurs
Statistik

ZHAW - Zürcher Hochschule für Angewandte Wissenschaften

Zum Kurs
Statistik

IU Internationale Hochschule

Zum Kurs
Statistik

Europa-Universität Flensburg

Zum Kurs

Die all-in-one Lernapp für Studierende

Greife auf Millionen geteilter Lernmaterialien der StudySmarter Community zu
Kostenlos anmelden Statistik
Erstelle Karteikarten und Zusammenfassungen mit den StudySmarter Tools
Kostenlos loslegen Statistik