Das arithmetische Mittel ist am einfachsten zu handhaben. Die Aussagekraft kann jedoch nur dann beurteilt werden, sofern auch die Standardabweichung und der Variationskoeffizient und/oder das Konfidenzintervall bestimmt werden.
Der Mittelwert ist eine der am häufigsten verwendeten statistischen Kennzahlen. Er wird als Durchschnittswert einer Verteilung berechnet und gibt somit einen guten Überblick über die zentralen Tendenzen der Daten. Doch wann ist ein Mittelwert aussagekräftig und wann nicht?
Ein Mittelwert ist dann aussagekräftig, wenn die Daten normalverteilt sind und keine Ausreißer enthalten. Eine Normalverteilung der Daten bedeutet, dass die Werte symmetrisch um den Mittelwert herum angeordnet sind. In diesem Fall gibt der Mittelwert eine gute Vorstellung davon, wo sich die meisten Daten befinden. Wenn jedoch Ausreißer in den Daten vorhanden sind, kann der Mittelwert stark von den tatsächlichen zentralen Tendenzen abweichen und somit unzuverlässig sein.
Der Median ist eine weitere Kennzahl, die die zentrale Tendenz der Daten angibt. Im Gegensatz zum Mittelwert ist der Median jedoch nicht anfällig für Ausreißer. Der Median ist der Wert, der genau in der Mitte der sortierten Daten liegt. Wenn die Daten symmetrisch um den Median herum angeordnet sind, bleibt der Median unverändert, wenn Ausreißer hinzugefügt werden. Wenn jedoch die Daten schief verteilt sind, kann ein Ausreißer dazu führen, dass sich der Median verändert.
Um den Median zu berechnen, müssen die Daten zuerst sortiert werden. Wenn die Anzahl der Daten ungerade ist, ist der Median der Wert, der genau in der Mitte liegt. Wenn die Anzahl gerade ist, wird der Median als Durchschnitt der beiden mittleren Werte berechnet.
Ein Mittelwert, der besonders empfindlich auf Ausreißer reagiert, ist der arithmetische Mittelwert. Wenn ein Ausreißer hinzugefügt wird, kann sich der arithmetische Mittelwert drastisch von den tatsächlichen zentralen Tendenzen entfernen. Ein robusterer Mittelwert ist der Median, der nicht durch Ausreißer beeinflusst wird.
Quartile sind Kennzahlen, die die Verteilung der Daten in vier gleich große Gruppen unterteilen. Das erste Quartil (Q1) ist der Wert, unter dem 25% der Daten liegen. Das zweite Quartil ist der Median und das dritte Quartil (Q3) ist der Wert, unter dem 75% der Daten liegen. Quartile sind sehr nützlich, um die Verteilung der Daten zu verstehen und Ausreißer zu identifizieren.
Der Modus ist der Wert, der am häufigsten in den Daten vorkommt. Wenn mehrere Werte dieselbe Häufigkeit haben, gibt es mehrere Modi. Der Modus ist eine nützliche Kennzahl, um die häufigsten Werte der Daten zu identifizieren.
Um das untere Quartil zu berechnen, müssen alle Daten in aufsteigender Reihenfolge sortiert werden. Anschließend muss das Median der unteren Hälfte der Daten (also die mittlere Zahl der kleineren Hälfte) ermittelt werden. Dieser Wert entspricht dem unteren Quartil.
Beim Median wird die Größe der Werte nicht berücksichtigt, sondern lediglich ihre Reihenfolge. Das bedeutet, dass extreme Werte, die weit von der Mitte entfernt sind, genauso viel Einfluss auf den Median haben wie Werte, die nahe beieinander liegen.
Excel berechnet die Quartile mithilfe der Funktion „QUARTIL“. Diese Funktion gibt den Wert zurück, der das angegebene Quartil der Daten darstellt. Zum Beispiel gibt „QUARTIL(A1:A10, 1)“ das Minimum zurück, „QUARTIL(A1:A10, 2)“ gibt das Median zurück und „QUARTIL(A1:A10, 3)“ gibt das oberste Quartil zurück.