VL 5: HLM - Inferenzstatistik at Universität Jena | Flashcards & Summaries

Select your language

Suggested languages for you:
Log In Start studying!

Lernmaterialien für VL 5: HLM - Inferenzstatistik an der Universität Jena

Greife auf kostenlose Karteikarten, Zusammenfassungen, Übungsaufgaben und Altklausuren für deinen VL 5: HLM - Inferenzstatistik Kurs an der Universität Jena zu.

TESTE DEIN WISSEN

Inferenzstatistische Absicherung:

Bootstrap-Konfidenzintervalle

Lösung anzeigen
TESTE DEIN WISSEN
  • Für Feste und zufällige Effekte im Modell können alternativ Bootstrap-basierte Kifidenzintervalle berechnet werden
    1. Paramterisches Bootstrapping: auf Basis der geschätzten Paramter wird eine Population simuliert, aus der wiederholt Zufallsstichproben der Größe n gezogen werden
    2. Wenn man dann einen interessierenden Kennwert (z.B. einen festen Effekt) in jeder dieser Stichproben bestimmt, kann künstlich eine SKPV (?) erzeugt werden, um z.B. das KI um den geschätzten Parameter zu bestimmen
  • Parameter = signifikant, wenn Konfidenzintervall von 0 verschieden ist
    1. Achtung: Das KI der Varianzkomponenten kann die 0 nicht umschließen, da die Varianzen nicht negativ werden können
Lösung ausblenden
TESTE DEIN WISSEN

Inferenzstatistische Absicherung: 

Wald-Test/ t-Test

Lösung anzeigen
TESTE DEIN WISSEN
  • Wald-Test: macht sich Eigenschaften der ML-Schätzung zunutze à liefert bei sehr großen Stichproben eine approximativ standardnormalverteilte Prüfgröße
  • Feste Effekte kann man so auf Signifikanz testen, indem man Estimate durch seinen geschätzten Standardfehler teilt à resultierende Prüfgröße (= t-Wert in R) mit entsprechender Verteilung vergleichen
  • Problem dabei: Stichproben meist nicht groß genug, Test beruht dann auf falschen Verteilungsannahmen
  • Side Note: lmer Package gibt keine p-Werte aus, weil Freiheitsgrade der tatsächlichen Verteilung im Mehrebenenkotext schwer zu bestimmen sind
Lösung ausblenden
TESTE DEIN WISSEN

Problem Definition inkrementelle Varianzaufklärung in HLM

Lösung anzeigen
TESTE DEIN WISSEN
  • In HLM Varianz und Residualvarianz auf mehreren Ebenen = verschiedene Möglichkeiten aufgeklärte Varianz zu definieren
  • Geschätzte Residualvairanz auf Level 2 kann sich wegen Stichprobenfehler durch Hinzunahme weiterer  Prädiktoren vergrößern (= was eigentlich nicht sein kann, es kann höchstens keine neue Varianz aufgeklärt werden, aber keinensfalls weniger)
  • Deswegen in der Literatur viele verschiedene Vorschläge für Pseudo  -Werte um (inkrementelle) Varianzaufklärung zu quantifizieren

Lösung ausblenden
TESTE DEIN WISSEN

Maximum Likelihood Methode

Lösung anzeigen
TESTE DEIN WISSEN

Maximum-Likelihood Methode

  • Am häufigsten verwendeten Verfahren zur Parameterschätzung in Mehrebenenmodellen ist Maximum-Likelihood (ML) Methode
  • ML basiert auf Maximierung der Likelihood-funktion, die die Wahrscheinlichkeit der Daten gegeben der Modellparameter beschreibt
  • Algorithmus beginnt mit plausiblen Startwerten für die Modellparamter, bestimmt wie wahescheinlich es ist gegeben diese Paramter die beobachteten Daten zu finden
  • Parameter werden dann schrittweise (iterativ) so verändert, dass die Wahrscheinlichkeit die gegeben Daten zu beobachten immer weiter maximiert wird
  • Prozess endet, wenn:
    1. Verbesserung der Likelihood einen kritischen Wert unterschreitet (= erfolgreich)
    2. Voreingestellte Maximale Anzahl an Interationen erreicht ist (= nicht erfolgreich)
  • Feste und zufällige Effekte werden gleichzeitig geschätzt
Lösung ausblenden
TESTE DEIN WISSEN

Restricted Maximum Likelihood Methode (RML)

Lösung anzeigen
TESTE DEIN WISSEN
  • Hier werden zuerst die zufälligen Effekte, dann die festen Effekte geschätzt
  • Bei der RML Methode werden zufällige bei geringer Anzahl an Clustern weniger verzerrt geschätzt
  • RML erlaubt aber keinen Vergleich von Modellen, die sich in ihren festen Effekten unterscheiden
    1. Dazu muss ein Modell mit FML geschätzt werden
  • RML ist in R Standardeinstellung
Lösung ausblenden
TESTE DEIN WISSEN

Voraussetzung der ML-Methode für HLM

Lösung anzeigen
TESTE DEIN WISSEN
  • Residuen auf Level 1 sind unabhängig + identisch normalverteilt
  • Residuen auf Level 2 sind unabhängig + identisch multivariat normalverteilt mit Erwartungswert von 0 + Varianz- -Kovarianz Matrix, die dem Modell entspricht
  • Schätzung der festen Effekte ist relativ robust gegen die Verletzung der Normalverteilung
  • Schätzung der zufällige Effekt bei ausreichend großer Stichprobe auf Level 2
Lösung ausblenden
TESTE DEIN WISSEN

Konditionale R2 - Koeffizienten

Lösung anzeigen
TESTE DEIN WISSEN

- aufgeklärte Varianz = feste Level 1 und feste Level 2 Effekte + Interceptvarianz + Slopevarianz

Lösung ausblenden
TESTE DEIN WISSEN

F-Test nach Kenward und Roger

Lösung anzeigen
TESTE DEIN WISSEN
  • Beim F-Test nach Kenward und Roger werden die Freiheitsgrade im Nenner angepasst
  • Auf Basis der approximierten Freiheitsgrade können Standardfehler, p-Werte und Konfidenzintervalle bestimmt werden
  • Mit dem Test können feste Effekte auf Signifikanz geprüft werden
  • Der Modellvergleich nach Kenward & Roger ist konservativer als der „normale“ Modellvergleich per Devianztest/LRT
  • Er gilt insbesondere bei kleinen Stichproben (auf Level 2) als präzisere Methoden und ist deshalb für die Situation empfohlen
Lösung ausblenden
TESTE DEIN WISSEN

Empfehlungen zu R2-Koeffizienten in HLM

Lösung anzeigen
TESTE DEIN WISSEN
  • Welche Koeffizienten man betrachtet hängt davon ab, welche Effekt von zentralem Interesse sind
  • Je genereller Effekt, desto unspezifischer die Aussage
  • Je nachdem wie Verhältnis zwischen within und between Varianz ist, kann es ein verzerrtes Bild vermittelnt, wenn man nur levelspezifische Varianzkoeffizienten berichtet
  • Deshalb Empfehlung, neben ausgewählten levelspezifischen Koeffizienten auch den entsprechenden totalen -Koeffizienten zu berichten 
    1. Grund: ich bekomme sonst einen falschen Eindruck von Gesamtverteilung
Lösung ausblenden
TESTE DEIN WISSEN

Modellvergleich per Informationskriterien

Lösung anzeigen
TESTE DEIN WISSEN
  • Kann man benutzen, wenn die Modelle nicht geschachtelt sind kein direkter Weg über einen inferenzstatistischen Test
  • Modelle können aber deskriptiv über Informationskriterien (ICs) verglichen werden
  • Die ICs beziehen Devianz (= Passung der Modelle auf die Daten) + Anzahl der Parameter (= Sparsamkeit der Modelle) mit ein
  • AIC und BIC à Modelle mit kleineren Werte sind besser
Lösung ausblenden
TESTE DEIN WISSEN

Poweranalysen

Lösung anzeigen
TESTE DEIN WISSEN
  • Nur weil Koeffizienten und ihre Standardfehler akkurat geschätzt werden –> muss nicht heißen, dass Power der durchgeführten inferenzstatistischen Tests hoch ist
  • Auch für Mehrebenenmodelle gibt es Ansätze den optimalen Stichprobenumfang vor der Analysen zu bestimmen (d.h. a-priori Poweranalyse durchführen)
  • Es gibt hier sowohl formelbasierte Ansätze als auch solche die auf Simulation beruhen
    1. Formelbasierte Ansätze (siehe Eid-Buch) haben den Nachteil das sie modellspezifisch sind und nur für eine begrenzte Menge an Modellen zur Verfügung stehen
    2. Simulationsbasierte Ansätze sind flexibler, werden in der Umsetzung aber schnell sehr komplex
  • Wir beschränken uns deshalb auf die genannten allgemeinen Empfehlungen zur Stichprobengröße
Lösung ausblenden
TESTE DEIN WISSEN

Marginale  R2-Koeffizitenten

Lösung anzeigen
TESTE DEIN WISSEN

- nur feste Effekte als aufgeklärte Varianz

- = Anteil fester Level 1 und fester Level 2 Effekte

- totale Varianz

Lösung ausblenden
  • 133050 Karteikarten
  • 2253 Studierende
  • 95 Lernmaterialien

Beispielhafte Karteikarten für deinen VL 5: HLM - Inferenzstatistik Kurs an der Universität Jena - von Kommilitonen auf StudySmarter erstellt!

Q:

Inferenzstatistische Absicherung:

Bootstrap-Konfidenzintervalle

A:
  • Für Feste und zufällige Effekte im Modell können alternativ Bootstrap-basierte Kifidenzintervalle berechnet werden
    1. Paramterisches Bootstrapping: auf Basis der geschätzten Paramter wird eine Population simuliert, aus der wiederholt Zufallsstichproben der Größe n gezogen werden
    2. Wenn man dann einen interessierenden Kennwert (z.B. einen festen Effekt) in jeder dieser Stichproben bestimmt, kann künstlich eine SKPV (?) erzeugt werden, um z.B. das KI um den geschätzten Parameter zu bestimmen
  • Parameter = signifikant, wenn Konfidenzintervall von 0 verschieden ist
    1. Achtung: Das KI der Varianzkomponenten kann die 0 nicht umschließen, da die Varianzen nicht negativ werden können
Q:

Inferenzstatistische Absicherung: 

Wald-Test/ t-Test

A:
  • Wald-Test: macht sich Eigenschaften der ML-Schätzung zunutze à liefert bei sehr großen Stichproben eine approximativ standardnormalverteilte Prüfgröße
  • Feste Effekte kann man so auf Signifikanz testen, indem man Estimate durch seinen geschätzten Standardfehler teilt à resultierende Prüfgröße (= t-Wert in R) mit entsprechender Verteilung vergleichen
  • Problem dabei: Stichproben meist nicht groß genug, Test beruht dann auf falschen Verteilungsannahmen
  • Side Note: lmer Package gibt keine p-Werte aus, weil Freiheitsgrade der tatsächlichen Verteilung im Mehrebenenkotext schwer zu bestimmen sind
Q:

Problem Definition inkrementelle Varianzaufklärung in HLM

A:
  • In HLM Varianz und Residualvarianz auf mehreren Ebenen = verschiedene Möglichkeiten aufgeklärte Varianz zu definieren
  • Geschätzte Residualvairanz auf Level 2 kann sich wegen Stichprobenfehler durch Hinzunahme weiterer  Prädiktoren vergrößern (= was eigentlich nicht sein kann, es kann höchstens keine neue Varianz aufgeklärt werden, aber keinensfalls weniger)
  • Deswegen in der Literatur viele verschiedene Vorschläge für Pseudo  -Werte um (inkrementelle) Varianzaufklärung zu quantifizieren

Q:

Maximum Likelihood Methode

A:

Maximum-Likelihood Methode

  • Am häufigsten verwendeten Verfahren zur Parameterschätzung in Mehrebenenmodellen ist Maximum-Likelihood (ML) Methode
  • ML basiert auf Maximierung der Likelihood-funktion, die die Wahrscheinlichkeit der Daten gegeben der Modellparameter beschreibt
  • Algorithmus beginnt mit plausiblen Startwerten für die Modellparamter, bestimmt wie wahescheinlich es ist gegeben diese Paramter die beobachteten Daten zu finden
  • Parameter werden dann schrittweise (iterativ) so verändert, dass die Wahrscheinlichkeit die gegeben Daten zu beobachten immer weiter maximiert wird
  • Prozess endet, wenn:
    1. Verbesserung der Likelihood einen kritischen Wert unterschreitet (= erfolgreich)
    2. Voreingestellte Maximale Anzahl an Interationen erreicht ist (= nicht erfolgreich)
  • Feste und zufällige Effekte werden gleichzeitig geschätzt
Q:

Restricted Maximum Likelihood Methode (RML)

A:
  • Hier werden zuerst die zufälligen Effekte, dann die festen Effekte geschätzt
  • Bei der RML Methode werden zufällige bei geringer Anzahl an Clustern weniger verzerrt geschätzt
  • RML erlaubt aber keinen Vergleich von Modellen, die sich in ihren festen Effekten unterscheiden
    1. Dazu muss ein Modell mit FML geschätzt werden
  • RML ist in R Standardeinstellung
Mehr Karteikarten anzeigen
Q:

Voraussetzung der ML-Methode für HLM

A:
  • Residuen auf Level 1 sind unabhängig + identisch normalverteilt
  • Residuen auf Level 2 sind unabhängig + identisch multivariat normalverteilt mit Erwartungswert von 0 + Varianz- -Kovarianz Matrix, die dem Modell entspricht
  • Schätzung der festen Effekte ist relativ robust gegen die Verletzung der Normalverteilung
  • Schätzung der zufällige Effekt bei ausreichend großer Stichprobe auf Level 2
Q:

Konditionale R2 - Koeffizienten

A:

- aufgeklärte Varianz = feste Level 1 und feste Level 2 Effekte + Interceptvarianz + Slopevarianz

Q:

F-Test nach Kenward und Roger

A:
  • Beim F-Test nach Kenward und Roger werden die Freiheitsgrade im Nenner angepasst
  • Auf Basis der approximierten Freiheitsgrade können Standardfehler, p-Werte und Konfidenzintervalle bestimmt werden
  • Mit dem Test können feste Effekte auf Signifikanz geprüft werden
  • Der Modellvergleich nach Kenward & Roger ist konservativer als der „normale“ Modellvergleich per Devianztest/LRT
  • Er gilt insbesondere bei kleinen Stichproben (auf Level 2) als präzisere Methoden und ist deshalb für die Situation empfohlen
Q:

Empfehlungen zu R2-Koeffizienten in HLM

A:
  • Welche Koeffizienten man betrachtet hängt davon ab, welche Effekt von zentralem Interesse sind
  • Je genereller Effekt, desto unspezifischer die Aussage
  • Je nachdem wie Verhältnis zwischen within und between Varianz ist, kann es ein verzerrtes Bild vermittelnt, wenn man nur levelspezifische Varianzkoeffizienten berichtet
  • Deshalb Empfehlung, neben ausgewählten levelspezifischen Koeffizienten auch den entsprechenden totalen -Koeffizienten zu berichten 
    1. Grund: ich bekomme sonst einen falschen Eindruck von Gesamtverteilung
Q:

Modellvergleich per Informationskriterien

A:
  • Kann man benutzen, wenn die Modelle nicht geschachtelt sind kein direkter Weg über einen inferenzstatistischen Test
  • Modelle können aber deskriptiv über Informationskriterien (ICs) verglichen werden
  • Die ICs beziehen Devianz (= Passung der Modelle auf die Daten) + Anzahl der Parameter (= Sparsamkeit der Modelle) mit ein
  • AIC und BIC à Modelle mit kleineren Werte sind besser
Q:

Poweranalysen

A:
  • Nur weil Koeffizienten und ihre Standardfehler akkurat geschätzt werden –> muss nicht heißen, dass Power der durchgeführten inferenzstatistischen Tests hoch ist
  • Auch für Mehrebenenmodelle gibt es Ansätze den optimalen Stichprobenumfang vor der Analysen zu bestimmen (d.h. a-priori Poweranalyse durchführen)
  • Es gibt hier sowohl formelbasierte Ansätze als auch solche die auf Simulation beruhen
    1. Formelbasierte Ansätze (siehe Eid-Buch) haben den Nachteil das sie modellspezifisch sind und nur für eine begrenzte Menge an Modellen zur Verfügung stehen
    2. Simulationsbasierte Ansätze sind flexibler, werden in der Umsetzung aber schnell sehr komplex
  • Wir beschränken uns deshalb auf die genannten allgemeinen Empfehlungen zur Stichprobengröße
Q:

Marginale  R2-Koeffizitenten

A:

- nur feste Effekte als aufgeklärte Varianz

- = Anteil fester Level 1 und fester Level 2 Effekte

- totale Varianz

VL 5: HLM - Inferenzstatistik

Erstelle und finde Lernmaterialien auf StudySmarter.

Greife kostenlos auf tausende geteilte Karteikarten, Zusammenfassungen, Altklausuren und mehr zu.

Jetzt loslegen

Das sind die beliebtesten StudySmarter Kurse für deinen Studiengang VL 5: HLM - Inferenzstatistik an der Universität Jena

Für deinen Studiengang VL 5: HLM - Inferenzstatistik an der Universität Jena gibt es bereits viele Kurse, die von deinen Kommilitonen auf StudySmarter erstellt wurden. Karteikarten, Zusammenfassungen, Altklausuren, Übungsaufgaben und mehr warten auf dich!

Mehr Karteikarten anzeigen

Das sind die beliebtesten VL 5: HLM - Inferenzstatistik Kurse im gesamten StudySmarter Universum

Inferenzstatistik

Hochschule für Gesundheit

Zum Kurs
Inferenzstatistik

FOM Hochschule für Oekonomie & Management

Zum Kurs
Inferenzstatistik

RWTH Aachen

Zum Kurs
Inferenzstatistik

Universität Magdeburg

Zum Kurs

Die all-in-one Lernapp für Studierende

Greife auf Millionen geteilter Lernmaterialien der StudySmarter Community zu
Kostenlos anmelden VL 5: HLM - Inferenzstatistik
Erstelle Karteikarten und Zusammenfassungen mit den StudySmarter Tools
Kostenlos loslegen VL 5: HLM - Inferenzstatistik