Precision und Recall

Definition

Precision (Praezision) und Recall (Trefferquote) sind die zwei wichtigsten Evaluationsmetriken für Klassifikationsmodelle -- besonders wenn Klassenungleichgewichte vorliegen. Beide beantworten unterschiedliche Fragen und haben unterschiedliche Kosten bei Fehlern.

Precision = Von allen als positiv vorhergesagten Fällen, wie viele waren tatsaechlich positiv?
Formel: TP / (TP + FP)
Frage: Wenn das Modell Alarm schlaegt, wie wahrscheinlich ist es, dass wirklich etwas passiert?

Recall = Von allen tatsaechlich positiven Fällen, wie viele wurden vom Modell erkannt?
Formel: TP / (TP + FN)
Frage: Wie viele der tatsaechlichen Eskalationen hat das Modell übersehen?

Precision und Recall stehen in einem Zielkonflikt: Wenn man Recall maximiert (alle Eskalationen finden), sinkt Precision (mehr falsche Alarme). Wenn man Precision maximiert (nur sichere Alarme), sinkt Recall (mehr verpasste Eskalationen).

Ben Kraiem et al. (2023) nutzten Accuracy als Hauptmetrik (94,4%), aber in der Praxis des Risikomanagements sind Precision und Recall weit aussagekräftiger. Ein Modell mit 94% Accuracy kann bei 5% Eskalationsrate trotzdem 50% der kritischen Fälle verpassen -- wenn die Minderheitsklasse systematisch schlechter klassifiziert wird.

Warum es wichtig ist

Im Risikomanagement ist die Wahl zwischen Precision und Recall eine strategische Entscheidung:

Hoher Recall = Sicherheit -- Sie verpassen kaum eine Eskalation, akzeptieren aber mehr falsche Alarme. Gut, wenn der Schaden einer verpassten Eskalation extrem hoch ist (z. B. Pharma-Studienabbruch).
Hohe Precision = Effizienz -- Jeder Alarm ist relevant, aber Sie verpassen einige Eskalationen. Gut, wenn falsche Alarme teuer sind (z. B. Management-Eskalationen, die Ressourcen binden).
F1-Score = Balance -- Das harmonische Mittel aus Precision und Recall. Nuetzlich, wenn beide gleich wichtig sind.

Die richtige Balance haengt vom Kontext ab. Ein Feueralarm sollte hohen Recall haben (lieber einmal zu viel als zu wenig). Ein Medikamententest sollte hohe Precision haben (keine falsch-positiven Nebenwirkungen).

Aversight und Precision/Recall

Aversight optimiert nicht für eine einzelne Metrik, sondern für den geschaeftlichen Nutzen. Unsere Modelle werden so kalibriert, dass der Recall für kritische Eskalationen >90% liegt -- wir wollen keine verpassten Budget-UEberschreitungen. Gleichzeitig halten wir die Precision auf einem Niveau, das das operative Team nicht überfordert. Der Benutzer kann über einen Schieberegler die Balance anpassen: Mehr Sicherheit (hoher Recall) oder mehr Effizienz (hohe Precision). Das Modell passt den Entscheidungsthreshold dynamisch an.

Definition

Warum es wichtig ist

Aversight und Precision/Recall

Verwandte Begriffe

Risk Intelligence ist kein Black Box. Lassen Sie uns zeigen, wie sie funktioniert.

Precision und Recall

Definition

Warum es wichtig ist

Aversight und Precision/Recall

Verwandte Begriffe

Verwandte Inhalte

Risk Intelligence ist kein Black Box. Lassen Sie uns zeigen, wie sie funktioniert.