Kumulierte Binomialverteilung

Definition

Die kumulierte Binomialverteilung (auch Verteilungsfunktion der Binomialverteilung) gibt die Wahrscheinlichkeit an, höchstens $ k $ Erfolge in $ n $ Versuchen zu erzielen:

$$F(k) = P(X \leq k) = \sum_{i=0}^{k} \binom{n}{i} p^i (1-p)^{n-i}$$

Die kumulierte Verteilung summiert alle Einzelwahrscheinlichkeiten von 0 bis $ k $ auf. Sie ist eine monoton wachsende Treppenfunktion mit $ F(-1) = 0 $ und $ F(n) = 1 $. Der Sprung an der Stelle $ k $ entspricht gerade $ P(X = k) $.

Vorteile der kumulierten Darstellung

Die kumulierte Verteilung vereinfacht viele Berechnungen erheblich, denn die meisten praktischen Fragestellungen lassen sich als „höchstens“- oder „mindestens“-Fragen formulieren. Statt viele Einzelwahrscheinlichkeiten zu addieren, liest man einen einzigen kumulierten Wert ab oder bildet einfache Differenzen.

Wichtige Umrechnungen:

$ P(X = k) = F(k) – F(k-1) $
$ P(X \geq k) = 1 – F(k-1) $
$ P(X > k) = 1 – F(k) $
$ P(k_1 \leq X \leq k_2) = F(k_2) – F(k_1 – 1) $

Verwendung von Tabellen

Tabellen der kumulierten Binomialverteilung listen $ F(k) = P(X \leq k) $ für verschiedene Kombinationen von $ n $, $ p $ und $ k $ auf. In der Regel findet man Tabellen für $ p \leq 0{,}5 $. Für $ p > 0{,}5 $ nutzt man die Symmetriebeziehung:

$$P(X \leq k \mid n, p) = P(Y \geq n – k \mid n, 1-p) = 1 – P(Y \leq n – k – 1 \mid n, 1-p)$$

wobei $ Y \sim B(n, 1-p) $. Man „spiegelt“ also die Verteilung, indem man Erfolg und Misserfolg vertauscht.

Beispiel mit Tabelle

Für $ X \sim B(15, 0{,}4) $ sollen verschiedene Wahrscheinlichkeiten bestimmt werden. Aus einer Tabelle liest man ab (gerundete Werte): $ F(3) = P(X \leq 3) \approx 0{,}0905 $, $ F(6) \approx 0{,}6098 $, $ F(8) \approx 0{,}9050 $.

$ P(X = 6) = F(6) – F(5) \approx 0{,}6098 – 0{,}4032 = 0{,}2066 $
$ P(X \geq 7) = 1 – F(6) \approx 1 – 0{,}6098 = 0{,}3902 $
$ P(4 \leq X \leq 8) = F(8) – F(3) \approx 0{,}9050 – 0{,}0905 = 0{,}8145 $

GTR-Funktionen

Der GTR berechnet kumulierte Wahrscheinlichkeiten direkt über die Funktion binomcdf(n, p, k). Viele Modelle erlauben auch die Angabe einer unteren Grenze: binomcdf(n, p, k₁, k₂) für $ P(k_1 \leq X \leq k_2) $. Dies macht Tabellen bei Verfügbarkeit eines GTR weitgehend überflüssig.

Grafische Darstellung

Die kumulierte Verteilung wird als Treppenfunktion dargestellt: Auf der x-Achse die möglichen Werte, auf der y-Achse die kumulierten Wahrscheinlichkeiten. Die Funktion beginnt bei 0, steigt in Stufen und erreicht bei $ k = n $ den Wert 1. Die Stufenhöhen entsprechen den Einzelwahrscheinlichkeiten. Die steilsten Stufen liegen im Bereich des Erwartungswerts, wo die Einzelwahrscheinlichkeiten am größten sind.

Quantile der Binomialverteilung

Das $ \alpha $-Quantil $ k_\alpha $ ist der kleinste Wert $ k $, für den $ F(k) \geq \alpha $ gilt. Es beantwortet die Frage: „Bis zu wie vielen Erfolgen liegt man mit Wahrscheinlichkeit $ \alpha $?“ Quantile werden bei Hypothesentests zur Bestimmung kritischer Werte benötigt.

Zusammenfassung

Die kumulierte Binomialverteilung fasst Einzelwahrscheinlichkeiten zusammen und ermöglicht die effiziente Berechnung von Intervall-, Mindestens- und Höchstens-Wahrscheinlichkeiten. Sie wird über Tabellen, den GTR oder die Symmetriebeziehung ausgewertet. Die grafische Darstellung als Treppenfunktion gibt einen schnellen Überblick über die Verteilungsform. Quantile der kumulierten Verteilung sind die Grundlage für Hypothesentests.