Fehler 1. und 2. Art
Die zwei möglichen Fehlarten
Bei einem Hypothesentest trifft man eine Entscheidung auf Basis von Stichprobendaten – und diese Entscheidung kann richtig oder falsch sein. Es gibt genau zwei Arten von Fehlentscheidungen:
- Fehler 1. Art (\( \alpha \)-Fehler, „false positive“): Die Nullhypothese \( H_0 \) wird abgelehnt, obwohl sie wahr ist.
- Fehler 2. Art (\( \beta \)-Fehler, „false negative“): Die Nullhypothese \( H_0 \) wird beibehalten, obwohl sie falsch ist.
Die folgende Tabelle fasst alle vier möglichen Entscheidungssituationen zusammen:
| \( H_0 \) wahr | \( H_0 \) falsch | |
|---|---|---|
| \( H_0 \) beibehalten | richtig | Fehler 2. Art (\( \beta \)) |
| \( H_0 \) abgelehnt | Fehler 1. Art (\( \alpha \)) | richtig |
Wahrscheinlichkeit des Fehlers 1. Art
Die Wahrscheinlichkeit für einen Fehler 1. Art ist gleich dem Signifikanzniveau \( \alpha \): Man lehnt \( H_0 \) ab, wenn die Testgröße im kritischen Bereich liegt, und dieser Bereich hat unter \( H_0 \) die Wahrscheinlichkeit \( \alpha \). Übliche Werte sind \( \alpha = 0{,}05 \) oder \( \alpha = 0{,}01 \).
Durch die Wahl von \( \alpha \) kontrolliert man die Wahrscheinlichkeit des Fehlers 1. Art direkt. Ein kleineres \( \alpha \) bedeutet weniger Risiko, eine korrekte Nullhypothese fälschlich abzulehnen.
Wahrscheinlichkeit des Fehlers 2. Art
Die Wahrscheinlichkeit für einen Fehler 2. Art, \( \beta \), ist die Wahrscheinlichkeit, dass die Testgröße unter \( H_1 \) im Annahmebereich liegt:
$$\beta = P(X \in \bar{K} \mid H_1)$$
Um \( \beta \) zu berechnen, muss man einen konkreten Wert für den Parameter unter \( H_1 \) annehmen. Ohne diesen Wert ist \( \beta \) nicht bestimmbar. Je weiter der wahre Parameter von \( H_0 \) abweicht, desto kleiner wird \( \beta \) (der Test erkennt Abweichungen leichter).
Beispiel
\( H_0: p = 0{,}5 \) gegen \( H_1: p > 0{,}5 \). Bei \( n = 100 \), \( \alpha = 0{,}05 \) ergibt sich der kritische Bereich \( K = \{59, 60, \ldots, 100\} \).
Fehler 1. Art: \( \alpha = P(X \geq 59 \mid p = 0{,}5) \approx 0{,}05 \).
Fehler 2. Art bei \( p = 0{,}6 \) (unter \( H_1 \)): \( \beta = P(X < 59 \mid p = 0{,}6) = P(X \leq 58 \mid p = 0{,}6) \). Mit \( \mu = 60, \sigma \approx 4{,}9 \): \( \beta \approx \Phi\left(\frac{58{,}5 - 60}{4{,}9}\right) = \Phi(-0{,}31) \approx 0{,}38 \). Also 38 % Wahrscheinlichkeit, eine tatsächliche Abweichung (\( p = 0{,}6 \)) zu übersehen.
Fehler 2. Art bei \( p = 0{,}7 \): \( \mu = 70, \sigma \approx 4{,}58 \). \( \beta \approx \Phi\left(\frac{58{,}5 – 70}{4{,}58}\right) = \Phi(-2{,}51) \approx 0{,}006 \). Bei deutlicherer Abweichung wird der Fehler 2. Art sehr klein.
Konflikt zwischen \( \alpha \) und \( \beta \)
Ein fundamentales Dilemma: Bei gegebener Stichprobengröße \( n \) kann man \( \alpha \) und \( \beta \) nicht gleichzeitig minimieren. Verkleinert man \( \alpha \) (strengere Ablehnungskriterien), vergrößert sich der Annahmebereich, und damit steigt \( \beta \). Den Konflikt löst man nur durch Erhöhen der Stichprobengröße \( n \): Je mehr Daten, desto kleiner können beide Fehlerwahrscheinlichkeiten werden.
Praktische Bedeutung
Welcher Fehler schwerwiegender ist, hängt vom Kontext ab. Bei einem medizinischen Test auf eine gefährliche Krankheit wäre ein Fehler 2. Art (Krankheit übersehen) oft schlimmer als ein Fehler 1. Art (falscher Alarm). Daher wählt man je nach Anwendung \( H_0 \) und \( H_1 \) so, dass der kritischere Fehler dem Fehler 1. Art entspricht und durch \( \alpha \) kontrollierbar ist.
Zusammenfassung
Beim Hypothesentest gibt es zwei Fehlerarten: Der Fehler 1. Art (\( \alpha \)) ist die fälschliche Ablehnung einer wahren Nullhypothese; der Fehler 2. Art (\( \beta \)) das Übersehen einer tatsächlichen Abweichung. \( \alpha \) wird vom Anwender gewählt, \( \beta \) ergibt sich aus der Testkonstruktion und dem wahren Parameterwert. Beide Fehler stehen im Zielkonflikt, der nur durch größere Stichproben auflösbar ist. Die bewusste Zuordnung des schwerwiegenderen Fehlers zum Fehler 1. Art ist ein wichtiges Prinzip der Testplanung.