Kommilitonen im Kurs Statistik an der Universität Jena. erstellen und teilen Zusammenfassungen, Karteikarten, Lernpläne und andere Lernmaterialien mit der intelligenten StudySmarter Lernapp. Jetzt mitmachen!
Jetzt mitmachen!
Statistik
Welche Eigenschaften hat das Residuum?
• E(ε) = 0.
• E(ε | X) = 0.
• E(ε | f(X)) = 0.
• Cov(ε,X) = 0 , falls X numerisch ist.
Statistik
Wie wird das Residuum definiert?
Das Residuum ε bezüglich einer Regression E(Y | X) ist definiert als Abweichung der Zufallsvariablen Y von ihrer
Regression E(Y|X) auf X.
In Formeln: ε = Y − E(Y | X)
Daraus folgt auch: Y = E(Y | X) + ε
Statistik
Wie kann man eine Regression parametrisieren?
Eine Regression E(Y | X) kann auf verschiedene Arten parametrisiert, d. h. durch verschiedene Gleichungen
dargestellt werden, in denen verschiedene Parameter vorkommen.
Der entscheidende Sachverhalt ist dabei, dass sich die Regression E(Y | X) selbst nicht ändert, obwohl die
Gleichung mit den darin vorkommenden Parametern anders aussieht.
Beispiel Mathematikleistung:
Parametrisierung A:
E(Y | X) = α0 + α1 · X
E(Matheleistung | Lehrmethode) = α0 + α1 · Lehrmethode
E(Matheleistung | Lehrmethode) = 2 + 0, 7 · Lehrmethode
Parametrisierung B (Zellenmittelwertemodell):
E(Y | X) = β0 · IX=0 + β1 · IX=1
E(Matheleistung | Lehrmethode) = β0 · ILehrmethode=0 + β1 · ILehrmethode=1
E(Matheleistung | Lehrmethode) = 2 · ILehrmethode=0 + 2, 7 · ILehrmethode=1
Statistik
Wie erzeigt man Beispieldaten?
>set.seed(34235423)
> N <- 500
> x1 <-rnorm(N,1,2)
> x2 <- x1 + rnorm(N,0,1)
> y <- 0.2 + 0.4*x1 + 0.3*x2 + rnorm(N)
Statistik
Was ist der VIF-Wert und welche Daumenregel kann man aufstellen?
Der sogenannte VIF (variance inflation factor) ist im Falle der Unabhängigkeit der Prädiktoren 1, er steigt mit
wachsender linearer Abhängigkeit.
Daumenregel: Der VIF-Wert sollte nicht über 5.0 gehen.
Statistik
Wie berechnet man den VIF?
VIF = 1/1-R2
Statistik
Was ist der Shapiro-Wilk Test?
Der Shapiro-Wilk Test kann prüfen, ob Residuen eines Modells normalverteilt sind.
>shapiro.test(residuals(m1b))
Shapiro-Wilk normality test
data: residuals(m1b)
W = 0.99851, p-value = 0.9511
Statistik
Was ist der Durbin-Watson Test?
Durbin-Watson Test: Überprüft, ob die Residuen unabhängig sind (keine Autokorrelation der Residuen). Dies
kann bei hierarchischen Designs (z.B. Schule, Klasse, Schüler) oder bei Messwiederholungsdesigns wichtig sein. Mögliche Lösungen: Mulitlevel bzw. Mixed Effects Regressionen.
> library(lmtest)
> dwtest(m1b)
Durbin-Watson test
data: m1b
DW = 2.1019, p-value = 0.8734
alternative hypothesis: true autocorrelation is greater than 0
Statistik
Was ist der Breusch-Pagan Test?
Einen statistischen Test auf Varianzgleichheit bietet der Breusch-Pagan Test.
> ncvTest(m1b)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 26.41563 Df = 1
p = 2.75304e-07
Statistik
Welche Ansätze zum Umgang mit fehlenden Werten gibt es?
1. Datenbasierte Ansätze
2. Imputationsbasierte Ansätze
3. Modellbasierte Ansätze
Statistik
Welche Datenbasierten Ansätze gibt es?
Datenbasierte Ansätze sind sehr populäre und häufig (unreflektiert) genutzte Techniken im Umgang mit fehlenden
Werten. Sie basieren auf Veränderungen der zugrundeliegenden Datenmatrix (daher datenbasierte Ansätze).
1. Complete Case Analysis
2. Available Case Analysis
Statistik
1. Datenbasierte Ansätze
Was ist die Complete Case Analysis?
Synonyme: Listwise deletion oder casewise deletion
Vorgehen:
Nur Fälle mit Werten auf jeder Variable in Analysen einbezogen, Ausschluss von Fällen mit mind.
einem fehlenden Wert auf irgendeiner Variable
Annahme: Fehlende Werte sind missing completely at random (MCAR)
Vorteile:
Einfache Anwendung
Standardanalysen können eingesetzt werden, da dafür vollständiger Datensatz zugrunde
gelegt wird
Bei fehlenden Werten, die vollständig zufällig sind, resultieren unverfälschte Schätzungen
Nachteile:
Informationsverlust da vollständiger Ausschluss auch (teilweise) vorhandener Daten
Verlust statistischer Power aufgrund der geringeren Stichprobengröße
Verzerrte Schätzungen bei systematischen (nicht MCAR) Missings
Für deinen Studiengang Statistik an der Universität Jena gibt es bereits viele Kurse auf StudySmarter, denen du beitreten kannst. Karteikarten, Zusammenfassungen und vieles mehr warten auf dich.
Zurück zur Universität Jena ÜbersichtsseiteStudySmarter ist eine intelligente Lernapp für Studenten. Mit StudySmarter kannst du dir effizient und spielerisch Karteikarten, Zusammenfassungen, Mind-Maps, Lernpläne und mehr erstellen. Erstelle deine eigenen Karteikarten z.B. für Statistik an der Universität Jena oder greife auf tausende Lernmaterialien deiner Kommilitonen zu. Egal, ob an deiner Uni oder an anderen Universitäten. Hunderttausende Studierende bereiten sich mit StudySmarter effizient auf ihre Klausuren vor. Erhältlich auf Web, Android & iOS. Komplett kostenfrei. Keine Haken.
Bestes EdTech Startup in Deutschland
Du bist schon registriert? Hier geht‘s zum Login