Hypergeometrische Verteilung
Grundidee und Modell
Die hypergeometrische Verteilung modelliert das Ziehen ohne Zurücklegen aus einer endlichen Grundmenge mit zwei Kategorien (z. B. „Erfolg“ und „Misserfolg“). Im Gegensatz zur Binomialverteilung, die Unabhängigkeit der Ziehungen voraussetzt, berücksichtigt die hypergeometrische Verteilung, dass die Zusammensetzung der Urne sich mit jeder Ziehung verändert.
Das Modell: Eine Urne enthält \( N \) Objekte, davon \( M \) „Erfolge“ und \( N – M \) „Misserfolge“. Es werden \( n \) Objekte ohne Zurücklegen gezogen. Die Zufallsgröße \( X \) zählt die Anzahl der Erfolge in der Stichprobe.
Die Wahrscheinlichkeitsformel
Die Wahrscheinlichkeit, genau \( k \) Erfolge in der Stichprobe zu finden, ist:
$$P(X = k) = \frac{\binom{M}{k} \cdot \binom{N-M}{n-k}}{\binom{N}{n}}$$
Zähler: Anzahl der Möglichkeiten, \( k \) Erfolge aus \( M \) zu wählen, kombiniert mit \( n – k \) Misserfolgen aus \( N – M \). Nenner: Gesamtzahl der möglichen Stichproben vom Umfang \( n \) aus \( N \). Die Formel ist nur definiert für \( \max(0, n-(N-M)) \leq k \leq \min(n, M) \).
Erwartungswert und Varianz
Der Erwartungswert der hypergeometrischen Verteilung ist:
$$E(X) = n \cdot \frac{M}{N}$$
Das ist intuitiv plausibel: Wenn der Anteil der Erfolge in der Grundmenge \( \frac{M}{N} \) beträgt, erwartet man in der Stichprobe vom Umfang \( n \) im Schnitt ebenfalls diesen Anteil.
Die Varianz lautet:
$$\text{Var}(X) = n \cdot \frac{M}{N} \cdot \frac{N-M}{N} \cdot \frac{N-n}{N-1}$$
Der letzte Faktor \( \frac{N-n}{N-1} \) ist der sogenannte Endlichkeitskorrekturfaktor, der die Varianz gegenüber der Binomialverteilung reduziert: Durch das Ziehen ohne Zurücklegen sind die Ergebnisse weniger streuend als bei Unabhängigkeit.
Beispiel: Qualitätskontrolle
Eine Charge von 100 Produkten enthält 8 defekte Teile. Es werden 10 Produkte ohne Zurücklegen geprüft. Wie wahrscheinlich ist es, genau 2 defekte zu finden?
\( N = 100, M = 8, n = 10, k = 2 \):
$$P(X = 2) = \frac{\binom{8}{2} \cdot \binom{92}{8}}{\binom{100}{10}} = \frac{28 \cdot \binom{92}{8}}{\binom{100}{10}}$$
Die Berechnung liefert \( P(X = 2) \approx 0{,}1540 \). Zum Vergleich: Die binomiale Näherung mit \( p = 0{,}08 \) ergäbe \( P(X = 2) \approx 0{,}1478 \) – die Werte sind sehr ähnlich, da \( n = 10 \) klein gegenüber \( N = 100 \) ist.
Näherung durch Binomialverteilung
Ist die Stichprobe klein im Vergleich zur Grundmenge (Faustregel: \( n \leq 0{,}05 \cdot N \)), so liefert die Binomialverteilung mit \( p = \frac{M}{N} \) eine gute Näherung der hypergeometrischen Verteilung. Der Endlichkeitskorrekturfaktor \( \frac{N-n}{N-1} \) liegt dann nahe bei 1, sodass die Varianzen praktisch übereinstimmen. Da die Binomialverteilung rechnerisch einfacher ist, nutzt man sie in solchen Fällen bevorzugt.
Anwendungen
Die hypergeometrische Verteilung tritt in vielen realen Kontexten auf: Stichprobenprüfung in der Qualitätskontrolle (ohne Zurücklegen), Kartenwahrscheinlichkeiten beim Skat oder Poker (Ziehen aus einem endlichen Kartendeck), Auswahl von Kommissionen (Ziehen ohne Zurücklegen aus einer Mitarbeiterliste), Meinungsumfragen in kleinen Populationen. Überall dort, wo die Grundmenge klein und das Zurücklegen nicht möglich oder unüblich ist.
GTR-Unterstützung
Viele grafische Taschenrechner bieten eine Funktion für die hypergeometrische Verteilung, oft unter Namen wie hypergpdf oder hygepdf. Die Eingabe erfolgt mit den Parametern \( N, M, n \) und \( k \). Für die kumulierte Verteilung existiert eine entsprechende cdf-Variante.
Zusammenfassung
Die hypergeometrische Verteilung ist das korrekte Modell für das Ziehen ohne Zurücklegen aus einer endlichen Population mit zwei Kategorien. Erwartungswert und Varianz sind einfach zu berechnen, wobei die Varianz um den Endlichkeitskorrekturfaktor reduziert ist. Bei kleinen Stichproben im Vergleich zur Grundgesamtheit kann die Binomialverteilung als Näherung dienen. Typische Anwendungen sind Qualitätskontrolle und Ziehungen aus endlichen Mengen.