Totale Wahrscheinlichkeit

Totale Wahrscheinlichkeit

Grundidee: Aufteilen und Zusammensetzen

Der Satz der totalen Wahrscheinlichkeit ermöglicht es, die Wahrscheinlichkeit eines Ereignisses \( B \) zu berechnen, indem man verschiedene „Wege“ betrachtet, auf denen \( B \) eintreten kann. Man zerlegt den Ergebnisraum in disjunkte Teilmengen und berechnet den Beitrag jeder Teilmenge zu \( P(B) \) separat.

Formel

Bilden die Ereignisse \( A_1, A_2, \ldots, A_n \) eine vollständige Zerlegung von \( \Omega \) (d. h. sie sind paarweise disjunkt und ihre Vereinigung ist \( \Omega \)), so gilt:

$$P(B) = \sum_{i=1}^{n} P(B \mid A_i) \cdot P(A_i)$$

Im einfachsten Fall mit zwei Teilen \( A \) und \( \bar{A} \):

$$P(B) = P(B \mid A) \cdot P(A) + P(B \mid \bar{A}) \cdot P(\bar{A})$$

Anschaulich: Die Gesamtwahrscheinlichkeit von \( B \) setzt sich aus den Beiträgen der einzelnen „Szenarien“ zusammen, gewichtet mit deren Eintrittswahrscheinlichkeiten.

Im Baumdiagramm

Der Satz der totalen Wahrscheinlichkeit entspricht der zweiten Pfadregel im Baumdiagramm: Man summiert die Pfadwahrscheinlichkeiten aller Pfade, die zum Ereignis \( B \) führen. Die erste Stufe des Baums stellt die Zerlegung dar (die \( A_i \)), die zweite Stufe die bedingte Wahrscheinlichkeit von \( B \) unter jeder Bedingung.

Beispiel 1: Produktionslinien

Eine Fabrik hat drei Produktionslinien. Linie 1 produziert 50 % der Gesamtmenge mit 2 % Ausschussrate, Linie 2 produziert 30 % mit 3 % Ausschuss, Linie 3 produziert 20 % mit 5 % Ausschuss. Wie hoch ist die Gesamtausschussrate?

$$P(\text{Ausschuss}) = 0{,}02 \cdot 0{,}5 + 0{,}03 \cdot 0{,}3 + 0{,}05 \cdot 0{,}2 = 0{,}01 + 0{,}009 + 0{,}01 = 0{,}029 = 2{,}9\%$$

Beispiel 2: Krankheitstest

Mit \( P(K) = 0{,}005 \), Sensitivität \( P(+ \mid K) = 0{,}99 \), Falsch-Positiv-Rate \( P(+ \mid \bar{K}) = 0{,}02 \):

$$P(+) = P(+ \mid K) \cdot P(K) + P(+ \mid \bar{K}) \cdot P(\bar{K}) = 0{,}99 \cdot 0{,}005 + 0{,}02 \cdot 0{,}995 = 0{,}02485$$

Etwa 2,5 % aller getesteten Personen erhalten ein positives Ergebnis. Dieser Wert ist der Nenner in der Bayes-Formel und zeigt, dass die meisten positiven Ergebnisse von den vielen gesunden Personen stammen, die fälschlich positiv getestet werden.

Beispiel 3: Zweistufiges Urnenexperiment

Urne A enthält 4 rote und 1 blaue Kugel, Urne B enthält 2 rote und 3 blaue. Mit Wahrscheinlichkeit \( \frac{1}{3} \) wird aus Urne A gezogen, mit \( \frac{2}{3} \) aus Urne B. Wie wahrscheinlich ist es, eine rote Kugel zu ziehen?

$$P(R) = P(R \mid A) \cdot P(A) + P(R \mid B) \cdot P(B) = \frac{4}{5} \cdot \frac{1}{3} + \frac{2}{5} \cdot \frac{2}{3} = \frac{4}{15} + \frac{4}{15} = \frac{8}{15}$$

Zusammenhang mit dem Satz von Bayes

Der Satz der totalen Wahrscheinlichkeit liefert den Nenner der Bayes-Formel. Beide Sätze ergänzen sich: Die totale Wahrscheinlichkeit berechnet \( P(B) \) „vorwärts“ (von den Ursachen zur Beobachtung), der Satz von Bayes rechnet „rückwärts“ (von der Beobachtung zu den Ursachen). Zusammen bilden sie ein vollständiges Instrumentarium zur Analyse bedingter Zusammenhänge.

Zusammenfassung

Der Satz der totalen Wahrscheinlichkeit berechnet \( P(B) \) als gewichtete Summe bedingter Wahrscheinlichkeiten über eine vollständige Zerlegung des Ergebnisraums. Er entspricht der zweiten Pfadregel im Baumdiagramm und liefert den Nenner für den Satz von Bayes. Typische Anwendungen umfassen Qualitätskontrolle mit mehreren Produktionslinien, medizinische Tests und mehrstufige Zufallsexperimente mit unterschiedlichen Bedingungen.