Glossar

Klassenungleichgewicht

Wenn 95% Ihrer Projekte grün sind und nur 5% rot, lernt das Modell, immer "grün" zu sagen. Das ist kein Bug -- es ist Mathematik.

Definition

Klassenungleichgewicht (englisch: Imbalanced Data) beschreibt ein Problem in Machine Learning, bei dem die Zielklassen in einem Datensatz sehr ungleich verteilt sind. Ein klassisches Beispiel: In einem Portfolio mit 100 Projekten sind 95 stabil und 5 kritisch. Ein Modell, das immer "stabil" vorhersagt, erreicht 95% Accuracy -- und ist dennoch wertlos, weil es keine einzige kritische Situation erkennt.

Das Problem ist weit verbreitet. Kreditkartenbetrug (0,1% aller Transaktionen), Maschinenausfälle (2% aller Geräte), Projekteskalationen (5% aller Projekte) -- in allen Fällen ist die Minderheitenklasse die eigentlich interessante, aber statistisch unterrepraesentiert.

Ben Kraiem et al. (2023) hatten ein ähnliches Problem: 61 Traditional-Projekte vs. 38 Agile-Projekte. Ohne Gegenmaßnahmen haette das Modell systematisch Traditional bevorzugt -- unabhaengig von den tatsaechlichen Projektmerkmalen.

Warum es wichtig ist

Klassenungleichgewicht führt zu drei praktischen Problemen:

Die Lösungen sind vielfaeltig: SMOTE (synthetische Datenerzeugung), Kosten-sensitive Lernverfahren (höhere Strafe für Fehler bei der Minderheitsklasse), oder einfach die Wahl der richtigen Evaluationsmetriken (Precision, Recall, F1-Score statt Accuracy).

Aversight und Klassenungleichgewicht

Aversight begegnet dem Klassenungleichgewicht auf drei Ebenen: Erstens durch kosten-sensitives Lernen -- ein verpasster Budget-Alert wird staerker gewichtet als ein falscher Alarm. Zweitens durch dynamische Threshold-Anpassung: Wenn die Eskalationsrate in einem Quartal steigt, senkt das System den Alert-Threshold automatisch. Drittens durch kontinuierliches Retraining: Jedes neue Eskalations-Event fliest sofort in das Modell ein, sodass die Minderheitsklasse stetig wächst und besser gelernt wird.

Verwandte Begriffe

Risk Intelligence ist kein Black Box. Lassen Sie uns zeigen, wie sie funktioniert.

30 Sekunden -- und wir melden uns innerhalb von 24 Stunden.

Kostenlosen Maturity Check starten →