|
|
Inferenzstatistik

Die Inferenzstatistik ist – wie der Name schon sagt – ein Teilgebiet der Statistik. Doch was genau kann man sich unter der Inferenzstatistik eigentlich vorstellen und was ist das Ziel der Inferenzstatistik?

Mockup Schule

Entdecke über 50 Millionen kostenlose Lernmaterialien in unserer App.

Inferenzstatistik

Illustration

Lerne mit deinen Freunden und bleibe auf dem richtigen Kurs mit deinen persönlichen Lernstatistiken

Jetzt kostenlos anmelden

Nie wieder prokastinieren mit unseren Lernerinnerungen.

Jetzt kostenlos anmelden
Illustration

Die Inferenzstatistik ist – wie der Name schon sagt – ein Teilgebiet der Statistik. Doch was genau kann man sich unter der Inferenzstatistik eigentlich vorstellen und was ist das Ziel der Inferenzstatistik?

Inferenzstatistik – Definition

In der Inferenzstatistik – auch induktive, schließende oder beurteilende Statistik genannt – wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen.

Dazu werden verschiedene Verfahren der Inferenzstatistik angewendet, zum Beispiel Hypothesentests.

Nur selten kann eine Grundgesamtheit, die für eine Forschungsfrage untersucht werden soll, vollständig untersucht werden. Deshalb bietet es häufig an, nur einige repräsentative Einheiten der Grundgesamtheit, also eine Stichprobe, zu untersuchen und mittels Verfahren der Inferenzstatistik auf die interessierenden Parameter in der Grundgesamtheit zu schließen.

Wenn man zum Beispiel untersuchen möchte, wie sich die Lernleistung von Schüler*innen in Deutschland während des Home-Schoolings verändert hat, ist es nahezu unmöglich alle Schüler*innen an deutschen Schulen zu befragen. Stattdessen bietet es sich an, die Befragung an einer repräsentativen Stichprobe durchzuführen.

Aus den Informationen, die aus der Befragung an der Stichprobe gewonnen werden können, lässt sich anschließend mithilfe der Verfahren der Inferenzstatistik auf die allgemeine Lernleistung von Schüler*innen an deutschen Schulen während des Home-Schoolings schließen.

Inferenzstatistik – Abgrenzung von anderen Teilbereichen der Statistik

Wie du gerade gelernt hast, wird in der Inferenzstatistik von Daten aus einer Stichprobe auf die Ausprägung der beobachteten Parameter in der Grundgesamtheit geschlossen. Damit unterscheidet sich die Inferenzstatistik maßgeblich von der deskriptiven und explorativen Statistik.

Inferenzstatistik – Unterschied zur deskriptiven Statistik

In der deskriptiven Statistik (auch: beschreibende Statistik) wird zunächst ein Datensatz von einer Stichprobe erhoben und im Anschluss im Detail beschrieben.

Dafür werden unter anderem verschiedenste Lagemaße, wie der Modus, Median und Mittelwert, Streuungsmaße, wie zum Beispiel Varianz und Standardabweichung und Korrelationen bestimmt.

Die deskriptive Statistik umfasst auch die grafische Darstellung der Informationen aus dem Datensatz, zum Beispiel in Form eines Diagramms.

Die deskriptive Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Die deskriptive Statistik dient als Vorarbeit für die Inferenzstatistik.

Inferenzstatistik – Unterschied zur explorativen Statistik

In der explorativen Statistik (auch: erkundende Statistik) wird zunächst ein Datensatz von einer Stichprobe erhoben. Dieser wird dahingehend analysiert, ob aus ihm bisher unbekannte Datenstrukturen oder Zusammenhänge geschlussfolgert werden können. In der explorativen Statistik werden also Hypothesen generiert.

Die aufgestellten Hypothesen können anschließend mit den Methoden der Inferenzstatistik überprüft werden.

Die explorative Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der explorativen Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Sie dient als Vorarbeit für die Inferenzstatistik.

Grundlagen der Inferenzstatistik

Um die Methoden der Inferenzstatistik praktisch anwenden zu können, ist es wichtig, die Grundlagen, auf denen sie aufbaut, gut zu verstehen. Welche Begriffe du im Zusammenhang mit der Inferenzstatistik unbedingt kennen solltest, lernst du in diesem Abschnitt.

Inferenzstatistik – Grundgesamtheit und Stichprobe

Die Begriffe Grundgesamtheit und Stichprobe hast du sicher schon öfter gehört. Doch was genau hat es mit den beiden Begriffen nochmal auf sich und wie unterscheiden sie sich?

Inferenzstatistik – Grundgesamtheit

Die Grundgesamtheit umfasst alle Einheiten, die für die Untersuchung der Forschungsfrage relevant sind. Wer oder was zur Grundgesamtheit gehört, ist also davon abhängig, was genau untersucht werden soll.

Wenn die Forschungsfrage lautet: "Wie hat sich die Lernleistung von deutschen Schüler*innen durch die Corona-Pandemie verändert?", dann gehören alle deutschen Schüler*innen zur Grundgesamtheit.

Bei der Forschungsfrage "Wie hat sich die Lernleistung von Schüler*innen weltweit durch die Corona-Pandemie verändert?", dann gehören alle Schüler*innen auf der ganzen Welt zur Grundgesamtheit.

Inferenzstatistik – Stichprobe

Bei einer Stichprobe handelt es sich um einen Teil der Grundgesamtheit.

Für die meisten Verfahren der Inferenzstatistik ist es wichtig, dass es sich bei den Stichproben um Zufallsstichproben handelt. Bei einer Zufallsstichprobe werden die einzelnen Elemente der Stichprobe per Zufall und nicht willkürlich aus der Grundgesamtheit gewählt.

Wenn du die Forschungsfrage "Wie hat sich die Lernleistung von deutschen Schüler*innen durch die Corona-Pandemie verändert?" untersuchen möchtest, aber nicht die Grundgesamtheit befragen möchtest, kannst du zum Beispiel eine Liste aller deutschen Schulen anfertigen und aus dieser per Zufall 10 Schulen auswählen, an denen du alle Schüler*innen nach ihrer Lernleistung befragst.

Es gibt drei Gründe, warum man häufig Stichproben zur Untersuchung einer Forschungsfrage nutzt:

  • Zeitersparnis: Jede einzelne Einheit einer Grundgesamtheit zu untersuchen nimmt sehr viel Zeit in Anspruch.

Angenommen, die Grundgesamtheit beinhaltet 1000 Einheiten und man befragt eine zufällig ausgewählte Stichprobe mit dem Stichprobenumfang n = 500, dann dauert die Datenerhebung nur etwa halb so lange.

  • Kostenersparnis: Eine Einheit der Grundgesamtheit zu untersuchen, bringt auch immer gewisse Kosten mit sich.

Angenommen, die Grundgesamtheit beinhaltet 1000 Einheiten und man befragt eine zufällig ausgewählte Stichprobe mit dem Stichprobenumfang n = 500, dann kostet die Datenerhebung nur etwa halb so viel.

  • Volle Erhebung praktisch unmöglich: In einigen Bereichen ist es aus praktischen Gründen nicht sinnvoll die Daten der ganzen Grundgesamtheit zu erheben.

Stell dir vor, du bist ein Produzent von Geschirr und du möchtest testen, wie stabil die 1000 neu produzierten Teller sind. In der vorherigen Produktion sind etwa 10% der Teller bei einem einmaligen Sturz aus einem Meter Höhe direkt zerbrochen.

Wenn du nun testen möchtest, ob die neuen Teller genauso stabil sind, ist es wenig sinnvoll, alle 1000 neu produzierten Teller dem Stabilitätstest zu unterziehen. In der Summe werden nämlich ziemlich viele Teller – angenommen die Stabilität der neuen Produktion in genauso wie bei der alten Produktion, sind das in etwa 100 Teller – zerbrechen.

Es ist deshalb sinnvoller, eine kleine Menge der neu produzierten Teller zufällig auszuwählen und den Stabilitätstest nur an diesen durchzuführen.

Inferenzstatistik – Repräsentationsschluss

Nachdem geklärt wurde, was die Grundgesamtheit und eine Stichprobe sind, wird es dir nun einfacher fallen, das Prinzip des Repräsentationsschlusses zu verstehen.

Inferenzstatistik – Ziel des Repräsentationsschlusses

Das Ziel des Repräsentationsschlusses ist es, aus den erhobenen Daten einer Stichprobe auf die tatsächlichen Verhältnisse in der Grundgesamtheit zu schließen.

Da der Schluss von der Stichprobe auf die Grundgesamtheit repräsentativ sein soll, wird er Repräsentationsschluss genannt.

Inferenzstatistik – Prinzip des Repräsentationsschlusses

Das Grundprinzip des Repräsentationsschlusses sieht folgendermaßen aus:

  1. Ein bisher unbekannter Parameter in einer Grundgesamtheit soll bestimmt werden.
  2. Dafür wird eine Zufallsstichprobe mit dem Stichprobenumfang n aus der Grundgesamtheit gezogen.
  3. Aus Basis der Stichprobendaten kann der interessierende Parameter für die Stichprobe berechnet werden.
  4. Der Parameter der Stichprobe kann anschließend genutzt werden, um den Parameter in der Grundgesamtheit zu schätzen.

Inferenzstatistik – Hypothesentests

Der Hypothesentest ist ein Verfahren der beurteilenden Statistik, mit dem sich die Gültigkeit von Hypothesen überprüfen lässt.

Wichtig ist hierbei jedoch, dass sich eine Hypothese niemals beweisen lässt. Eine Hypothese kann durch das Ergebnis im Rahmen eines Hypothesentests lediglich gestützt werden. Das liegt daran, dass die Hypothesen unter Berücksichtigung eines gewissen Signifikanzniveaus getestet werden.

Das Signifikanzniveau gibt dabei die Wahrscheinlichkeit dafür an, eine in der Realität zutreffende Hypothese fälschlicherweise zu verwerfen.

Daher lässt sich eine Hypothese nie zu 100% bestätigen.

Hypothesentests werden, wenn man eine generelle Veränderung von einem Parameter testen möchte, beidseitig durchgeführt. Bei Verdacht auf Anstieg oder Abfallen von dem Parameter kann der Test auch einseitig durchgeführt werden. Je nach Kontext wird der Hypothesentest dann links- oder rechtsseitig durchgeführt.

Wenn du mehr zum Hypothesentest wissen möchtest, schau doch gerne in unseren dazugehörigen Artikel. Für die Vorgehensweise beim einseitigen und zweiseitigen Hypothesentest gibt es auch jeweils einen Artikel, der dich Schritt für Schritt durch den Hypothesentest führt.

Hypothesentests – Hypothesenarten

Es gibt verschieden Arten eine Hypothese zu überprüfen.

Eine Hypothese ist eine Behauptung, deren Gültigkeit durch statistische Verfahren überprüft werden muss. Um einen Hypothesentest durchführen zu können, müssen zunächst zwei grundlegende Hypothesen formuliert werden:

Die Nullhypothese und die Alternativhypothese .

Nullhypothese

Die Nullhypothese ist das Gegenteil der Alternativhypothese. Sie behauptet, dass keine Veränderung des untersuchten Parameters vorliegt. Im Hypothesentest wird geprüft, ob die Nullhypothese mit den Daten der Stichprobe vereinbar ist.

Du möchtest mehr über die Nullhypothese wissen? Auch zur Nullhypothese haben wir einen eigenen Artikel, in dem du alles Wichtige zu diesem Thema erfährst.

Alternativhypothese

Die Forschungsfrage untersucht meistens, ob sich ein bestimmter Parameter verändert hat. Daraus ergibt sich die Alternativhypothese , die behauptet, dass eine Veränderung des untersuchten Parameters vorliegt.

Hypothesentests – Irrtumswahrscheinlichkeit

Das Signifikanzniveau wird von den Durchführenden des Hypothesentests zu Beginn der Berechnung festgelegt. Es gibt die Wahrscheinlichkeit dafür an, einen Fehler 1. Art zu begehen, also die Nullhypothese, obwohl sie zutrifft, fälschlicherweise zu verwerfen. Das Signifikanzniveau wird daher auch als Irrtumswahrscheinlichkeit bezeichnet.

Die Irrtumswahrscheinlichkeit ist wichtig, um den Grenzen der Ablehnungs- und Annahmebereiche der Hypothesen zu bestimmen.

Für die Irrtumswahrscheinlichkeit wird häufig oder gewählt.

Du möchtest mehr über die Irrtumswahrscheinlichkeit wissen? Kein Problem, auch zur Irrtumswahrscheinlichkeit haben wir einen eigenen Artikel, in dem die Irrtumswahrscheinlichkeit noch einmal im Detail erläutert wird.

Hypothesentests – Fehlerarten

Bei jedem Hypothesentest gibt es zwei richtige und zwei falsche Testentscheidungsmöglichkeiten. Diese sind in der folgenden Tabelle dargestellt:

In der Realität
TestentscheidungNullhypothese trifft zuNullhypothese trifft nicht zu
Nullhypothese wird beibehaltenrichtige EntscheidungFehler 2. Art
Nullhypothese wird verworfenFehler 1. Artrichtige Entscheidung

Fehler 1. Art

Der Fehler 1. Art (auch genannt) wird begangen, wenn die Nullhypothese zwar in Wirklichkeit zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise verworfen wird.

Die Wahrscheinlichkeit einen Fehler 1. Art zu begehen ist gleich dem Signifikanzniveau .

Die Wahrscheinlichkeit einen Fehler 1. Art zu begehen kann demnach durch die Wahl des Signifikanzniveaus beeinflusst werden.

Fehler 2. Art

Der Fehler 2. Art (auch genannt) wird begangen, wenn die Nullhypothese in Wirklichkeit nicht zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise beibehalten wird.

Die Wahrscheinlichkeit einen Fehler 2. Art zu begehen ist gleich der Sensitivität des Tests .

Zusammenhang zwischen den Fehlerarten

Die Wahrscheinlichkeiten für einen Fehler 1. Art und einen Fehler 2. Art hängen miteinander zusammen.

Es gilt: Je größer der eine Fehler, desto kleiner der andere und umgekehrt.

Im Optimalfall ist sowohl die Wahrscheinlichkeit für den Fehler 1. Art als auch für den Fehler 2. Art möglichst gering.

Auch zu den Fehlern beim Testen von Hypothesen gibt es einen separaten Artikel auf unserer Plattform.

Inferenzstatistik - Das Wichtigste auf einen Blick

  • Die Inferenzstatistik ist neben der deskriptiven und explorativen Statistik einer der drei Teilbereiche der Statistik.
  • In der Inferenzstatistik wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen.
  • Eines der häufigsten Verfahren der Inferenzstatistik ist der Hypothesentest. Es gibt verschiedene Arten von Hypothesentests, in der Schule wird in der Regel der z-Test durchgeführt.
  • Wichtige Begriffe, die du im Zusammenhang mit Hypothesentests unbedingt kennen solltest, sind die folgenden: Nullhypothese, Alternativhypothese, Fehler 1. und 2. Art und Irrtumswahrscheinlichkeit

Häufig gestellte Fragen zum Thema Inferenzstatistik

In der Inferenzstatistik – auch induktive, schließende oder beurteilende Statistik genannt – wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen. Dazu werden verschiedene Verfahren der Inferenzstatistik angewendet, zum Beispiel Hypothesentests.

Ja, Korrelationen gehören zur deskriptiven Statistik. In der deskriptiven Statistik wird zunächst ein Datensatz von einer Stichprobe erhoben und im Anschluss im Detail beschrieben. 

In der deskriptiven Statistik wird zunächst ein Datensatz von einer Stichprobe erhoben und im Anschluss im Detail beschrieben. Die deskriptive Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Sie dient als Vorarbeit für die Inferenzstatistik.

Die deskriptive Statistik bezieht sich nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. 

In der Inferenzstatistik hingegen wird von Daten aus einer Stichprobe auf die Ausprägung der beobachteten Parameter in der Grundgesamtheit geschlossen.

Teste dein Wissen mit Multiple-Choice-Karteikarten

Welche Aussagen über die Nullhypothese sind richtig? Wähl aus.

Vervollständige den Satz. Die Nullhypothese...

Bei der Produktion von Eiswaffeln gehen 1 % der Eiswaffeln kaputt. Ein Mitarbeiter der Fabrik Waffel meint, dass in letzter Zeit mehr Eiswaffeln kaputtgehen. Er möchte dies mit einem Hypothesentest überprüfen.Wähl die richtige Nullhypothese für diesen Hypothesentest aus.

Weiter

Nenne die drei Teilbereiche der Statistik

  1. deskriptive Statistik
  2. explorative Statistik
  3. beurteilende Statistik

Beschreibe, was die Inferenzstatistik ist. 

In der Inferenzstatistik - auch induktive, schließende oder beurteilende Statistik genannt - wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen. 


Nenne drei Gründe, warum häufig Stichproben gezogen werden, um eine Forschungsfrage zu untersuchen. 

  1. Zeitersparnis
  2. Kostenersparnis
  3. volle Erhebung praktisch unmöglich

Gib an, in welchem Verhältnis die Nullhypothese und die Alternativhypothese zueinander stehen. 

Die Nullhypothese und die Alternativhypothese sind immer das Gegenteil voneinander. Sie schließen sich also gegenseitig aus. 

Bei der Berechnung eines Hypothesentests unterscheiden sich die Nullhypothese und die Alternativhypothese nur durch das mathematische Zeichen.

Vergleiche die deskriptive Statistik und die Inferenzstatistik.

Die deskriptive Statistik bezieht sich nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. 

In der Inferenzstatistik hingegen wird von Daten aus einer Stichprobe auf die Ausprägung der beobachteten Parameter in der Grundgesamtheit geschlossen

Erkläre den Begriff "Grundgesamtheit"!

Die Grundgesamtheit umfasst alle Einheiten, die für die Untersuchung der Forschungsfrage relevant sind. Wer oder was zur Grundgesamtheit gehört, ist davon abhängig, was genau untersucht werden soll.

Mehr zum Thema Inferenzstatistik

Schließ dich über 22 Millionen Schülern und Studierenden an und lerne mit unserer StudySmarter App!

Die erste Lern-App, die wirklich alles bietet, was du brauchst, um deine Prüfungen an einem Ort zu meistern.

  • Karteikarten & Quizze
  • KI-Lernassistent
  • Lernplaner
  • Probeklausuren
  • Intelligente Notizen
Schließ dich über 22 Millionen Schülern und Studierenden an und lerne mit unserer StudySmarter App! Schließ dich über 22 Millionen Schülern und Studierenden an und lerne mit unserer StudySmarter App!

Melde dich an für Notizen & Bearbeitung. 100% for free.

Entdecke Lernmaterial in der StudySmarter-App

Google Popup

Schließ dich über 22 Millionen Schülern und Studierenden an und lerne mit unserer StudySmarter App!

Schließ dich über 22 Millionen Schülern und Studierenden an und lerne mit unserer StudySmarter App!

Die erste Lern-App, die wirklich alles bietet, was du brauchst, um deine Prüfungen an einem Ort zu meistern.

  • Karteikarten & Quizze
  • KI-Lernassistent
  • Lernplaner
  • Probeklausuren
  • Intelligente Notizen
Schließ dich über 22 Millionen Schülern und Studierenden an und lerne mit unserer StudySmarter App!