Approximation der Binomialverteilung durch Normalverteilung

Grundidee

Für große Werte von $ n $ wird die Berechnung von Binomialwahrscheinlichkeiten aufwendig – die Binomialkoeffizienten und Potenzen werden sehr groß bzw. sehr klein. Glücklicherweise lässt sich die Binomialverteilung $ B(n, p) $ für großes $ n $ durch die Normalverteilung $ N(np, np(1-p)) $ approximieren. Diese Näherung vereinfacht Berechnungen erheblich und ist historisch der Hauptgrund für die Bedeutung der Normalverteilung.

Satz von Moivre-Laplace

Für $ X \sim B(n, p) $ mit $ n \to \infty $ gilt: Die standardisierte Zufallsgröße

$$Z = \frac{X – np}{\sqrt{np(1-p)}}$$

konvergiert in der Verteilung gegen die Standardnormalverteilung $ N(0, 1) $. Praktisch bedeutet das:

$$P(X \leq k) \approx \Phi\left(\frac{k – np}{\sqrt{np(1-p)}}\right)$$

Faustregel für die Anwendbarkeit

Die Normalapproximation ist hinreichend genau, wenn die Laplace-Bedingung erfüllt ist:

$$\sigma = \sqrt{np(1-p)} > 3 \quad \text{oder äquivalent} \quad np(1-p) > 9$$

Je näher $ p $ bei 0,5 liegt und je größer $ n $, desto besser ist die Approximation. Für extrem kleine oder große $ p $ braucht man ein größeres $ n $.

Stetigkeitskorrektur

Da die Binomialverteilung diskret und die Normalverteilung stetig ist, verbessert eine Stetigkeitskorrektur (Kontinuitätskorrektur) die Genauigkeit: Man erweitert das Intervall um je 0,5 an den Rändern:

$$P(X \leq k) \approx \Phi\left(\frac{k + 0{,}5 – np}{\sqrt{np(1-p)}}\right)$$

$$P(X = k) \approx \Phi\left(\frac{k + 0{,}5 – np}{\sigma}\right) – \Phi\left(\frac{k – 0{,}5 – np}{\sigma}\right)$$

Die Stetigkeitskorrektur gleicht aus, dass die Normalverteilung den Punkt $ k $ als Intervall $ [k – 0{,}5;\, k + 0{,}5] $ „sieht“.

Beispiel

Ein fairer Würfel wird 600-mal geworfen. Wie wahrscheinlich ist es, zwischen 90 und 110 Sechsen zu erhalten? $ X \sim B(600, \frac{1}{6}) $, $ \mu = 100 $, $ \sigma = \sqrt{600 \cdot \frac{1}{6} \cdot \frac{5}{6}} = \sqrt{\frac{500}{6}} \approx 9{,}13 $.

$$P(90 \leq X \leq 110) \approx \Phi\left(\frac{110{,}5 – 100}{9{,}13}\right) – \Phi\left(\frac{89{,}5 – 100}{9{,}13}\right) = \Phi(1{,}15) – \Phi(-1{,}15)$$

$$= 2\Phi(1{,}15) – 1 \approx 2 \cdot 0{,}8749 – 1 = 0{,}7498$$

Mit etwa 75 % Wahrscheinlichkeit fallen zwischen 90 und 110 Sechsen.

Vergleich mit dem exakten Wert

Die exakte Berechnung mit der Binomialformel (oder dem GTR) liefert für dieses Beispiel einen sehr ähnlichen Wert. Die Normalapproximation ist hier hervorragend, da $ \sigma \approx 9{,}13 > 3 $ deutlich erfüllt ist.

Zusammenfassung

Die Normalapproximation der Binomialverteilung ersetzt die aufwendige Binomialberechnung durch die einfachere Normalverteilung. Die Approximation ist gültig, wenn $ \sigma = \sqrt{npq} > 3 $. Die Stetigkeitskorrektur verbessert die Genauigkeit. Die z-Transformation führt auf die Standardnormalverteilung, deren Tabelle oder GTR-Funktion dann die Berechnung abschließt. Diese Approximation ist die Brücke zwischen der diskreten Binomialverteilung und der stetigen Normalverteilung.