Median: Unterschied zwischen den Versionen

Aus BS-Wiki: Wissen teilen
Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: Der '''Median''' (oder ''Zentralwert'') halbiert eine Verteilung, darf aber nicht mit dem Mittelwert verwechselt werden. == Median einer Stichprobe == Der Media...)
 
 
(3 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
 
Der '''Median''' (oder ''Zentralwert'') halbiert eine Verteilung, darf aber nicht mit dem [[Mittelwert]] verwechselt werden.  
 
Der '''Median''' (oder ''Zentralwert'') halbiert eine Verteilung, darf aber nicht mit dem [[Mittelwert]] verwechselt werden.  
 
  
 
== Median einer Stichprobe ==
 
== Median einer Stichprobe ==
  
Der Median <i>m</i> ist der Wert einer [[Stichprobe]], wenn höchstens die Hälfte der Beobachtungen in der Stichprobe einen Wert <math> < m </math> und höchstens die Hälfte einen Wert <math> > m </math> hat.
+
Sortiert man die Werte der Größe nach („geordnete Stichprobe“), so lässt sich der Median leicht bestimmen:
 
+
* Bei einer '''ungeraden Werteanzahl''' ist der Median der Wert an mittlerer Position, egal wie hoch der rechnerische [[Mittelwert]] ist, Beispiel:<br />5 Messwerte 1, 2, {{Mark|'''4'''}}, 5, 18. Der Median ist der Wert an der mittleren bzw. 3. Stelle, also 4. Das arithmetische Mittel dagegen beträgt 6.
Sortiert man die Beobachtungswerte der Größe nach („geordnete Stichprobe“), so ist der Median bei einer ungeraden Anzahl von Beobachtungen der Wert der in der Mitte dieser [[Folge (Mathematik)|Folge]] liegenden Beobachtung. Bei einer geraden Anzahl von Beobachtungen gibt es kein einziges mittleres Element, sondern zwei. Hier sind die Werte der beiden mittleren Beobachtungen sowie alle Werte dazwischen (obwohl diese bei keiner Beobachtung aufgetreten sind) ein Median der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.
 
 
 
Bei [[Intervallskala|kardinal skalierten]] Messgrößen (wenn es also sinnvoll möglich ist, die Differenz von Messwerten zu berechnen) verwendet man im Falle einer geraden Anzahl Beobachtungen meist das arithmetische Mittel der beiden mittleren Beobachtungswerte. Der Median <math>\tilde x</math> einer geordneten Stichprobe <math>(x_1, x_2, \dots, x_n)</math> von <math>n</math> Messwerten ist dann also
 
 
 
:<math>\tilde x =\begin{cases}
 
  x_\frac{n+1}{2}                                    & n\text{ ungerade}\\
 
  \frac 12\left(x_{\frac n2} + x_{\frac n2+1}\right) & n \text{ gerade.}
 
\end{cases}
 
</math>
 
 
 
Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. In diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der ''Untermedian'' <math>\tilde x_u = x_\frac{n}{2}</math> oder der ''Obermedian'' <math>\tilde x_o = x_{\frac{n}{2}+1}</math> genutzt und als ''Median'' bezeichnet.
 
 
 
Diese Medianbestimmung spielt beispielsweise bei [[Datenbanksystem]]en eine große Rolle, wie z. B. bei [[SQL#Abfrage: SELECT|SELECT-Abfragen]] mittels des Medians der Mediane.
 
 
 
=== Eigenschaften ===
 
 
 
Der Median <math>\tilde x</math>, und im Fall einer geraden Anzahl von Messwerten alle Werte <math>\tilde x</math> mit <math>\tilde{x}_u \le \tilde x \le \tilde{x}_o</math>, minimieren die Summe der absoluten Abweichungen, das heißt für <math>1 \le k \le n</math> gilt
 
 
 
:<math>\sum_{i=1}^n |\tilde x - x_i| \le \sum_{i=1}^n |x_k - x_i|.</math>
 
 
 
=== Beispiele ===
 
 
 
* Messwerte 1, 2, 4, 5, 18: ungerade Anzahl. Der Median (auch der Ober- und Untermedian) ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel ist 6.
 
* Messwerte 1, 1, 2, 3, 4, 37: gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Der Obermedian ist 3, und der Untermedian 2. Das arithmetische Mittel ist 8.
 
* Messwerte 1, 3, 3, 3: gerade Anzahl. Der Median ist ½ (3 + 3), also 3. Der Ober- und der Untermedian sind ebenfalls 3. Das arithmetische Mittel ist 2,5.
 
 
 
== Median einer Verteilung ==
 
 
 
[[Bild:BäckereiMed.png|300px|thumb|Dichtefunktion einer Dreiecksverteilung mit Median]]
 
 
 
Eine Verallgemeinerung des Begriffes liefert die [[Stochastik|stochastische]] Betrachtung einer [[Zufallsvariable]] <math>X</math> bzw. deren [[Verteilungsfunktion]] <math>F</math>. Dort ist der Median das 0,5-[[Quantil]], also
 
 
 
:<math>\inf\{x\in\R:F(x) \ge \frac 12\}.</math>
 
 
 
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten ''Obermedian''.
 
 
 
Er ist, neben beispielsweise [[Erwartungswert]], [[Modus (Statistik)|Modus]], ein [[Lageparameter]].
 
 
 
=== Beispiel ===
 
 
 
Bei der [[Dreiecksverteilung]]
 
 
 
:<math>f(x) = \frac x{18},\quad 0 \le x \le 6,</math>
 
 
 
ist der Median der <math>x</math>-Wert, welcher die Fläche
 
 
 
:<math>F(x)=\frac 12\cdot x\cdot\frac{x}{18}</math>
 
 
 
unter der [[Dichtefunktion]] in zwei gleich große Flächen teilt. Dieser Wert wird somit durch die Gleichung
 
 
 
:<math>F(m)=\frac 12\cdot m\cdot\frac{m}{18}=\frac 12</math>
 
 
 
bestimmt. Für deren Lösung <math>m=\sqrt{18}\approx 4{,}24</math> gilt damit <math>P(X \le 4{,}24) \approx 0{,}5</math>.
 
 
 
D.h. in diesem Beispiel ist der Median <math>m</math> nicht identisch mit dem Erwartungswert <math>E(X)=4</math>.
 
 
 
== Median von gruppierten Daten ==
 
 
 
Vor allem in den [[Sozialwissenschaft]]en wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern jene nur in [[Intervall (Mathematik)|Intervallen]] gruppiert vorliegen. So wird beispielsweise bei [[Umfrage]]n selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese [[Schätzung]] unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.
 
 
 
Es seien <math>n</math> die Anzahl ''aller'' Daten, <math>n_i</math> die jeweilige Anzahl der Daten der <math>i</math>-ten Gruppe und <math>u_i</math> bzw. <math>o_i</math> die entsprechenden oberen bzw. unteren Intervallgrenzen.
 
 
 
Zunächst wird nun die ''mediane Klasse'' (oder ''mediane Gruppe'') bestimmt, d.&nbsp;h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z.&nbsp;B. die <math>m</math>-te Gruppe. Wenn keine weiteren Angaben über die [[Wahrscheinlichkeitsverteilung|Verteilung]] der Daten gegeben sind, wird z.&nbsp;B. [[Gleichverteilung]] postuliert, sodass man sich der [[Lineare Interpolation|linearen Interpolation]] als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:
 
 
 
:<math>x_{med} = u_m+\frac{\frac n2 - \sum\limits_{k=1}^{m-1}n_k}{n_m} \cdot (o_m-u_m).</math>
 
 
 
Im Gegensatz zur konventionellen Definition des Medians muss dieser ''nicht'' zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.
 
 
 
===== Beispiel =====
 
 
 
''Einkommen'':
 
{|  class="prettytable"
 
|-
 
! Klasse (<math>i</math>)
 
! Bereich (<math>u_i</math> bis <math>o_i</math>)
 
! Gruppengröße (<math>n_i</math>)
 
|-
 
| 1
 
| mind. 0, weniger als 1500
 
| 160
 
|-
 
| 2
 
| mind. 1500, weniger als 2500
 
| 320
 
|-
 
| 3
 
| mind. 2500, weniger als 3500
 
| 212
 
|}
 
 
 
Man berechne
 
 
 
:<math>\textstyle{\frac n2 = \frac{212+320+160}2 = \frac{692}2=346}.</math>
 
 
 
Also liegt der Median in der 2. Klasse (d.&nbsp;h. <math>m=2</math>), da die erste Klasse nur 160 Elemente umfasst. Somit ergibt sich als Schätzung für den Median
 
  
:<math>\textstyle{x_{med} = 1500+\frac{346-160}{320}\cdot (2500-1500) = 2081{,}25}.</math>
+
* Bei einer '''geraden Werteanzahl''' gibt es zwei Werte an mittlerer Position. In diesem Fall ergibt sich der Merian als Mittelwert dieser beiden Werte, Beispiel 1:<br />6 Messwerte 1, 1, {{Mark|'''2, 3'''}}, 4, 37. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½{{*}}(2 + 3) = 2,5. Das arithmetische Mittel dagegen beträgt 8. Beispiel 2:<br />4 Messwerte: 1, 3, 3, 3. Der Median ist ½{{*}}(3 + 3), also 3. Das arithmetische Mittel ist 2,5.
 
 
Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der [[Summenkurve]]. Hier wird der [[Abszisse]]nwert <math>x_{med}\,</math> gesucht, der zum [[Ordinate]]nwert <math>\textstyle{\frac{n}{2}}</math> gehört. Bei kleinerem und geradem <math>n</math> kann auch stattdessen der Ordinatenwert <math>\textstyle{\frac{n}{2}+1}</math> gewählt werden.
 
  
 
== Vorteile des Medians ==
 
== Vorteile des Medians ==
  
Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als [[Lageparameter]] für nicht [[Normalverteilung|normalverteilte]] Grundgesamtheiten.
+
Bei Ausreißern beschreibt der Median die Tendenz besser als der Mittelwert, Beispiel:
 
 
Beispiel:
 
  
 
Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:
 
Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:
Zeile 119: Zeile 19:
 
Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.
 
Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.
  
== Alternativen ==
+
{{www}}
 
 
Eine Alternative zum Median bei der Ermittlung des Masseneinkommens aus einer gegebenen Einkommensverteilung ist die von [[Amartya Sen]] vorgeschlagene [[Wohlfahrtsfunktion]].
 
 
 
== Siehe auch ==
 
 
 
{{Wiktionary|Median}}
 
 
 
* [[Medianalter]]
 
* [[Medianfilter]]
 
* [[Medianwähler]]
 
 
 
== Weblinks ==
 
  
 
Ausführliche Erläuterungen zur Berechnung des Medians auf dem „Fußweg“:
 
Ausführliche Erläuterungen zur Berechnung des Medians auf dem „Fußweg“:

Aktuelle Version vom 25. März 2012, 22:11 Uhr

Der Median (oder Zentralwert) halbiert eine Verteilung, darf aber nicht mit dem Mittelwert verwechselt werden.

Median einer Stichprobe

Sortiert man die Werte der Größe nach („geordnete Stichprobe“), so lässt sich der Median leicht bestimmen:

  • Bei einer ungeraden Werteanzahl ist der Median der Wert an mittlerer Position, egal wie hoch der rechnerische Mittelwert ist, Beispiel:
    5 Messwerte 1, 2, 4, 5, 18. Der Median ist der Wert an der mittleren bzw. 3. Stelle, also 4. Das arithmetische Mittel dagegen beträgt 6.
  • Bei einer geraden Werteanzahl gibt es zwei Werte an mittlerer Position. In diesem Fall ergibt sich der Merian als Mittelwert dieser beiden Werte, Beispiel 1:
    6 Messwerte 1, 1, 2, 3, 4, 37. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ · (2 + 3) = 2,5. Das arithmetische Mittel dagegen beträgt 8. Beispiel 2:
    4 Messwerte: 1, 3, 3, 3. Der Median ist ½ · (3 + 3), also 3. Das arithmetische Mittel ist 2,5.

Vorteile des Medians

Bei Ausreißern beschreibt der Median die Tendenz besser als der Mittelwert, Beispiel:

Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:

  • 9 Personen verdienen jeweils EUR 1.000 und
  • 1 Person verdient EUR 1.000.000.

Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.

Weblinks

Ausführliche Erläuterungen zur Berechnung des Medians auf dem „Fußweg“:

Wikibooks und Statscan