StudySmarter - Die all-in-one Lernapp.
4.8 • +11k Ratings
Mehr als 5 Millionen Downloads
Free
In diesem Artikel erhältst du einen Überblick über die "Deskriptive Statistik". Die deskriptive Statistik gehört inhaltlich zum Thema "Zufallsgrößen" im Fach Mathematik.
Da das Thema der deskriptiven Statistik sehr breit gefächert ist, kann in diesem Artikel nicht auf jede Kennzahl in voller Tiefe eingegangen werden. Wenn du zu einer bestimmten Kennzahl mehr wissen möchtest, empfehle ich dir, dass du dir zusätzlich unseren dazugehörigen Artikel anschaust.
Die deskriptive Statistik ist neben der erkundenden und schließenden Statistik eins von drei Teilgebieten der Statistik. Diese drei Teilgebiete unterscheiden sich grundlegend voneinander.
Das Ziel der deskriptiven Statistik ist es, einen Überblick über den vorliegenden Datensatz zu geben. Dabei werden die Daten geordnet und systematisch zusammengefasst. Die deskriptive Statistik ist deshalb besonders bei umfangreichen Datensätzen hilfreich.
Die deskriptive Statistik zielt nicht darauf ab, einen Kausalschluss von der Stichprobe auf die zugrundeliegende Grundgesamtheit zu ziehen. Stattdessen konzentriert sie sich auf die Beschreibung des vorliegenden Datensatzes und wird deshalb auch beschreibende Statistik genannt.
Um die Daten zu ordnen, werden in der deskriptiven Statistik verschiedene Methoden genutzt. Dazu gehören Tabellen und Diagramme. Außerdem gibt es eine Reihe an Kennzahlen, mit denen große Datenmengen auf einzelne Parameter reduziert werden können.
Die beschreibende Statistik steht in der Regel am Anfang einer Datenanalyse. Damit leistet sie wertvolle Vorarbeit für die schließende Statistik.
Da sich die drei Teilgebiete der Statistik grundlegend voneinander unterschieden, ist es wichtig zu verstehen, was die Inhalte und Ziele der einzelnen Teilgebiete sind.
Du hast bereits gelernt, was das Ziel der deskriptiven Statistik ist: Beschreiben und Zusammenfassen.
Doch worum geht es bei der erkundenden und schließenden Statistik?
In der erkundenden Statistik (auch: explorative Statistik) versuchen die Forscher bislang unbekannte Zusammenhänge in den Datensätzen zu erkennen. Aus diesen leiten sie neue Forschungshypothesen ab.
Die deskriptive Statistik leistet deshalb Vorarbeit für die erkundende Statistik.
In der schließenden Statistik (auch: induktive Statistik oder Inferenzstatistik) untersuchen die Forscher, ob die aus den Stichprobendaten gewonnenen Hypothesen auf die Grundgesamtheit verallgemeinerbar sind. Dafür verwenden sie Testverfahren wie zum Beispiel Hypothesentests.
Auch für die schließende Statistik ist die Anwendung der deskriptiven Statistik im Voraus notwendig.
Das Skalen- oder Messniveau einer Variablen ist entscheidend dafür, welche statistischen Auswertungsmethoden bei dieser Variablen überhaupt sinnvoll sind. Deshalb ist die Bestimmung des Skalenniveaus ein wichtiger Bestandteil der deskriptiven Statistik.
Man unterscheidet zwischen Nominalskala, Ordinalskala und metrischer Skala. Wo die Unterschiede und Besonderheiten dieser Skalen liegen, erfährst du im folgenden Abschnitt.
Wenn du bei einer Variablen nur unterscheiden kannst, ob ihre Ausprägungen gleich oder ungleich sind, hat die Variable Nominalskalenniveau.
Beispiele für Variablen mit Nominalskalenniveau sind Farben, Länder oder Schulfächer.
Bei Objekten in den Farben Rot, Grün und Gelb kannst du nur sagen, ob sie die gleiche oder unterschiedliche Farben haben. Du kannst sie aber nicht in eine Rangreihe bringen. Deshalb liegt Nominalskalenniveau vor.
Kannst du die Ausprägungen einer Variablen in eine Rangreihe bringen, hat die Variable Ordinalskalenniveau. Die Abstände der Ausprägungen sind jedoch - im Gegensatz zur metrischen Skala - nicht interpretierbar.
Beispiele für Variablen mit Ordinalskalenniveau sind Windstärken, Schulnoten oder Ränge beim Militär.
Über die Windstärken 6 und 12 kannst du lediglich sagen, dass Windstärke 12 stärker ist als Windstärke 6. Die Aussage "Wind bei Windstärke 12 ist doppelt so stark wie bei Windstärke 6" ist nicht zulässig. Es liegt also Ordinalskalenniveau vor.
Wenn die Abstände der Variablenausprägungen interpretierbar sind, hat die Variable metrisches Skalenniveau. Bei Variablen mit metrischem Skalenniveau ist Addition und Subtraktion möglich.
Beim metrischen Skalenniveau unterscheidet man außerdem zwischen Intervallskala und Verhältnisskala:
Existiert kein natürlicher Nullpunkt der Variablen, handelt es sich um eine intervallskalierte Variable.
Beispiele hierfür sind Jahreszahlen und Temperaturangaben. Je nach Kalender bzw. Einheit wird von einem anderen Nullpunkt ausgegangen, ein natürlicher Nullpunkt existiert deshalb bei diesen Variablen nicht.
Existiert ein natürlicher Nullpunkt der Variablen, handelt es sich um eine verhältnisskalierte Variable.
Beispiele hierfür sind Preise in Euro oder Längen in cm.
Bei Variablen mit Verhältnisskalenniveau ist Multiplikation und Division möglich.
Die deskriptive Statistik verwendet verschiedene Methoden, um große Datensätze anschaulich zusammenzufassen. In diesem Abschnitt erhältst du einen Überblick über diese Methoden.
Tabellen stellen die Daten in Matrixform dar. Dabei unterscheidet man Spalten und Zeilen. Spalten beinhalten in der Regel die Variablen, Zeilen die Beobachtungsobjekte.
In Tabellen können absolute und relative Häufigkeiten eingetragen werden.
Hier siehst du eine Beispieltabelle mit absoluten Häufigkeiten:
Diagramme dienen der Veranschaulichung und Visualisierung von Daten. Am häufigsten werden das Streu-, Säulen- und Kreisdiagramm, sowie der Boxplot verwendet.
Eine Abbildung dieser Diagramme findest du hier:
Bei Diagrammen kann es - im Gegensatz zur Darstellung in Tabellen - zu einem Informationsverlust kommen, da die Daten vor der Erstellung eines Diagramms meist zusammengefasst werden müssen.
Inzwischen gibt es auch einige Datenanalyseprogramme für den Computer. Dazu gehören unter anderem SPSS und das Statistikprogramm R. Diese helfen dir besonders bei großen Datenmengen bei der deskriptiven Auswertung deines Datensatzes.
In der deskriptiven Statistik gibt es drei Gruppen von Kennzahlen, mit denen Datensätze beschrieben werden können: Lagemaße, Streuungsmaße und Zusammenhangsmaße.
Der folgende Abschnitt gibt dir einen Überblick über die verschiedenen Kennzahlen.
Lagemaße informieren über das Zentrum einer Verteilung. Die wichtigsten Lagemaße sind der Mittelwert, der Modus und der Median.
Zur Wiederholung:
Mittelwert: Durchschnittswert der Verteilung
Modus: häufigster Wert der Verteilung
Median: liegt in der nach Größe geordneten Datenreihe genau in der Mitte und teilt damit den Datensatz in zwei gleich große Hälften
Die Lagemaße können miteinander übereinstimmen, müssen sie aber nicht. Aus der Lage der einzelnen Parameter können Aussagen über die Schiefe der Verteilung getroffen werden:
Die Verteilung ist
Streuungsmaße informieren über die Streuung der Werte um das Zentrum der Verteilung. Die Streuung der Verteilung kann eng oder breit sein.
Die wichtigsten Streuungsmaße sind die Varianz, die Standardabweichung, die Spannweite und der Variationskoeffizient.
Zur Wiederholung:
Varianz: quadrierte, durchschnittliche Abweichung der Werte von ihrem Erwartungswert
Standardabweichung: Wurzel der Varianz, gibt durchschnittliche Abweichung der Werte vom Mittelwert wieder
Spannweite: Differenz zwischen größtem und kleinstem Wert der Verteilung
Variationskoeffizient: Standardabweichung geteilt durch Mittelwert, gibt prozentuale Streuung um den Mittelwert wieder
Zusammenhangsmaße informieren über den Zusammenhang zwischen zwei Variablen. Der Zusammenhang wird auch Korrelation genannt. Zusammenhangsmaße geben die Stärke und die Richtung der Korrelation wieder.
Je nach Skalenniveau können unterschiedliche Zusammenhangsmaße berechnet werden:
In diesem Artikel hast du eine Menge zum Thema deskriptive Statistik gelernt. Hier findest du eine Zusammenfassung der Punkte, die du dir unbedingt merken solltest:
In der Statistik sammelt man Daten zu einem interessierenden Gegenstandsbereich, untersucht diese und wertet sie anschließend aus.
Damit hilft die Statistik dabei in Entscheidungssituationen bessere Entscheidungen treffen zu können.
Man unterscheidet zwischen deskriptiver, erkundender und schließender Statistik.
Die deskriptive Statistik ist neben der explorativen und induktiven Statistik ein Teilgebiet der Statistik. Ihr Ziel ist es, einen Überblick über einen vorliegenden Datensatz zu geben. Dabei werden die Daten geordnet und systematisch zusammengefasst.
In der deskriptiven Statistik gibt es drei verschiedene Kennzahlenarten, die dabei helfen, den Datensatz zusammenzufassen: Lagemaße, Streuungsmaße und Zusammenhangsmaße.
Mithilfe von Tabellen und Diagrammen können die Daten außerdem visuell aufbereitet werden.
Die Statistik gliedert sich in drei Teilbereiche: die deskriptive Statistik, die erkundende Statistik und die schließende Statistik.
Sei rechtzeitig vorbereitet für deine Prüfungen.
Teste dein Wissen mit spielerischen Quizzes.
Erstelle und finde Karteikarten in Rekordzeit.
Erstelle die schönsten Notizen schneller als je zuvor.
Hab all deine Lermaterialien an einem Ort.
Lade unzählige Dokumente hoch und habe sie immer dabei.
Kenne deine Schwächen und Stärken.
Ziele Setze dir individuelle Ziele und sammle Punkte.
Nie wieder prokrastinieren mit unseren Lernerinnerungen.
Sammle Punkte und erreiche neue Levels beim Lernen.
Lass dir Karteikarten automatisch erstellen.
Erstelle die schönsten Lernmaterialien mit unseren Vorlagen.
Melde dich an für Notizen & Bearbeitung. 100% for free.