StudySmarter - Die all-in-one Lernapp.
4.8 • +11k Ratings
Mehr als 5 Millionen Downloads
Free
Der Boxplot hat viele verschiedene Bezeichnungen und wird unter anderem auch Box-Whisker-Plot und Kastengrafik genannt.
Der Boxplot ist ein Diagramm, das die Verteilung statistischer Daten grafisch darstellt. Die Darstellung ermöglicht einen schnellen Überblick darüber, über welchen Bereich sich die Daten erstrecken und wie sie in diesem Bereich verteilt sind. Sie wird deshalb häufig zur Zusammenfassung großer Datenmengen verwendet.
Die Grundidee der Kastengrafik ist es, die mittleren 50 Prozent einer Verteilung mithilfe einer Box darzustellen. In dieser Box ist der Median eingezeichnet. Durch die Whisker, also die Linien von der Box weg, werden die Werte dargestellt, die größer oder kleiner als die mittleren 50 Prozent der Verteilung sind.
Der Boxplot enthält alle Werte der Fünf-Punkte-Zusammenfassung: den Median, den unteren und oberen Angelpunkt und die beiden Extremwerte. Im Folgenden lernst du diese und alle weiteren Begriffe kennen, die du im Umgang mit der Kastengrafik brauchst.
Der Median ist der Wert, der bei einer nach der Größe geordneten Datenreihe genau in der Mitte steht. Wenn die Datenreihe aus einer geraden Anzahl an Werten besteht, wird der Median aus dem arithmetischen Mittel der beiden mittleren Werte berechnet. Der Median teilt den vorliegenden Datensatz in zwei Hälften, die jeweils 50% der Daten umfassen.
Stell dir vor, du hast folgende Daten in einer Stichprobe von 10 Personen erhoben:
58, 59, 67, 68, 69, 71, 74, 77, 91, 93
Der Median beträgt also:
Die Hälfte der Daten ist demnach kleiner als 70, die andere Hälfte größer.
Zusammen mit dem Median wird der Datensatz mithilfe der beiden Angelpunkte in vier Teile geteilt, die jeweils 25% der Daten umfassen. Diese Teile nennt man Quartile.
Der untere Angelpunkt, auch Q1 genannt, stellt den Median der kleineren Datenhälfte dar. Der untere Angelpunkt ist also der mittlere Wert der Datenreihe, die vom kleinsten Wert bis zum Median geht. In unserem Beispiel beträgt Q1 = 67.
Bei der Berechnung des oberen Angelpunktes, welcher auch Q3 genannt wird, gehst du genauso mit der größeren Datenhälfte vor. Im Beispiel gilt: Q3 = 77.
Q1 und Q3 bilden die Ränder der Box, die beim Boxplot gezeichnet wird. Im Intervall von Q1 und Q3 liegen 50% der Daten.
Das Minimum und das Maximum deines Datensatzes sind die Extremwerte. In der Regel geben die Extremwerte die Länge der Whisker an. Die Whisker sind die Geraden, die die Werte außerhalb der Box mit dieser verbinden.
Achtung
Bei Ausreißern endet der Whisker bereits früher! Die Vorgehensweise bei Ausreißern wird im nächsten Abschnitt noch einmal genauer erläutert.
Der kleinste Wert in unserem Datensatz und damit das Minimum beträgt 58.
Der höchste Wert und damit das Maximum liegt bei 93.
Um zu erkennen, ob es sich bei den Extremwerten um Ausreißer handelt, musst du zuerst den Interquartilabstand ermitteln. Der Interquartilabstand wird auch IQA abgekürzt und wird folgendermaßen ermittelt: IQA = Q3 - Q1
Im Beispiel gilt: IQA = 77 - 67 = 10
Jeder Wert, der kleiner als die untere Ausreißergrenze ist, gilt als Ausreißer.
Die untere Ausreißergrenze berechnest du so:
Im Beispiel liegt kein unterer Ausreißer vor:
Das Minimum liegt bei 58 und ist demnach größer als die untere Ausreißergrenze.
Jeder Wert, der größer ist als die obere Ausreißergrenze, gilt als Ausreißer.
Die obere Ausreißergrenze wird folgendermaßen berechnet:
Im Beispiel liegt ein oberer Ausreißer vor:
Da 93 größer ist als die obere Ausreißergrenze, ist dieser Wert ein Ausreißer.
Der Whisker wird immer nur bis zum letzten Wert gezeichnet, der noch kein Ausreißer ist.Ausreißer werden im Boxplot mit einem Stern gekennzeichnet.
Du kennst nun alle wichtigen Begriffe, die du im Zusammenhang mit dem Boxplot brauchst. Jetzt steht dem Zeichnen eines Boxplots nichts mehr im Weg!
In der folgenden Abbildung siehst du den Boxplot für die Datenreihe:
58, 59, 67, 68, 69, 71, 74, 77, 91, 93
Der Median beträgt 70.
50% der Werte liegen zwischen dem unteren und oberen Angelpunkt, also zwischen 67 und 77.
Es gibt einen oberen Ausreißer. Dieser ist mit einem Stern gekennzeichnet.
Das Minimum liegt bei 58, der höchste Wert unterhalb der oberen Ausreißergrenze beträgt 91.
Alle Werte liegen zwischen 58 und 93.
Mit dem Wissen, das du jetzt hast, kannst du mühelos Kastengrafiken interpretieren. Im Folgenden erfährst du, wie du dabei vorgehen solltest und welche Probleme es bei der Interpretation geben kann.
Beim Interpretieren einer Kastengrafik solltest du diese Fragen beantworten:
Bei der Interpretation des Boxplots können sich einige Probleme ergeben.
Zum Einen kannst du am Boxplot den Stichprobenumfang der Daten nicht erkennen. Dafür muss zusätzlich die Datenreihe angegeben werden. Du kannst also bei alleiniger Betrachtung des Boxplots nicht erkennen, ob die Daten von 10 oder 10.000 Personen oder Objekten stammen.
Außerdem ist der Boxplot für detaillierte Analysen eher ungeeignet. Das liegt daran, dass du - bis auf die Extremwerte, die Angelpunkte und den Median - keine genauen Werte der Verteilung ablesen kannst. Die Kastengrafik gibt daher nur einen groben Überblick über die Daten.
In diesem Artikel hast du eine Menge zum Thema Boxplot gelernt. Hier findest du eine Zusammenfassung der Punkte, die du dir unbedingt merken solltest:
Ausreißer sind Werte, die kleiner als die untere Ausreißergrenze bzw. größer als die obere Ausreißergrenze sind.
Die untere Ausreißergrenze berechnest du so: Q1 - 1,5 * IQA
Die obere Ausreißergrenze berechnest du so: Q3 + 1,5 * IQA
Ausreißer werden im Boxplot mit einem Stern gekennzeichnet.
Beim Interpretieren einer Kastengrafik solltest angeben was das Minimum und das Maximum der Verteilung ist, wo der Median und die Angelpunkte liegen, wie groß der Interquartilabstand ist und ob es Ausreißer gibt. Außerdem solltest du auf Auffälligkeiten des Boxplots eingehen.
Zuerst bringst du die Werte in eine nach der Größe geordnete Datenreihe. Dann berechnest du den Median und die beiden Angelpunkte. Die Angelpunkte bilden den Rand der Box, den Median zeichnest du in diese Box ein. Von der Box ausgehend zeichnest du die Whisker zu den Extrempunkten und kennzeichnest am Schluss Ausreißer mit einem Stern.
Ein Boxplot ist sinnvoll, wenn du eine große Datenmenge übersichtlich zusammenfassen möchtest. Der Boxplot ermöglicht es, einen schnellen Überblick zu gewinnen, über welchen Bereich sich die Daten erstrecken und wie sie in diesem Bereich verteilt sind.
Sei rechtzeitig vorbereitet für deine Prüfungen.
Teste dein Wissen mit spielerischen Quizzes.
Erstelle und finde Karteikarten in Rekordzeit.
Erstelle die schönsten Notizen schneller als je zuvor.
Hab all deine Lermaterialien an einem Ort.
Lade unzählige Dokumente hoch und habe sie immer dabei.
Kenne deine Schwächen und Stärken.
Ziele Setze dir individuelle Ziele und sammle Punkte.
Nie wieder prokrastinieren mit unseren Lernerinnerungen.
Sammle Punkte und erreiche neue Levels beim Lernen.
Lass dir Karteikarten automatisch erstellen.
Erstelle die schönsten Lernmaterialien mit unseren Vorlagen.
Melde dich an für Notizen & Bearbeitung. 100% for free.