Wenn 95% Ihrer Projekte grün sind und nur 5% rot, lernt das Modell, immer "grün" zu sagen. Das ist kein Bug -- es ist Mathematik.
Klassenungleichgewicht (englisch: Imbalanced Data) beschreibt ein Problem in Machine Learning, bei dem die Zielklassen in einem Datensatz sehr ungleich verteilt sind. Ein klassisches Beispiel: In einem Portfolio mit 100 Projekten sind 95 stabil und 5 kritisch. Ein Modell, das immer "stabil" vorhersagt, erreicht 95% Accuracy -- und ist dennoch wertlos, weil es keine einzige kritische Situation erkennt.
Das Problem ist weit verbreitet. Kreditkartenbetrug (0,1% aller Transaktionen), Maschinenausfälle (2% aller Geräte), Projekteskalationen (5% aller Projekte) -- in allen Fällen ist die Minderheitenklasse die eigentlich interessante, aber statistisch unterrepraesentiert.
Ben Kraiem et al. (2023) hatten ein ähnliches Problem: 61 Traditional-Projekte vs. 38 Agile-Projekte. Ohne Gegenmaßnahmen haette das Modell systematisch Traditional bevorzugt -- unabhaengig von den tatsaechlichen Projektmerkmalen.
Klassenungleichgewicht führt zu drei praktischen Problemen:
Die Lösungen sind vielfaeltig: SMOTE (synthetische Datenerzeugung), Kosten-sensitive Lernverfahren (höhere Strafe für Fehler bei der Minderheitsklasse), oder einfach die Wahl der richtigen Evaluationsmetriken (Precision, Recall, F1-Score statt Accuracy).
Aversight begegnet dem Klassenungleichgewicht auf drei Ebenen: Erstens durch kosten-sensitives Lernen -- ein verpasster Budget-Alert wird staerker gewichtet als ein falscher Alarm. Zweitens durch dynamische Threshold-Anpassung: Wenn die Eskalationsrate in einem Quartal steigt, senkt das System den Alert-Threshold automatisch. Drittens durch kontinuierliches Retraining: Jedes neue Eskalations-Event fliest sofort in das Modell ein, sodass die Minderheitsklasse stetig wächst und besser gelernt wird.
30 Sekunden -- und wir melden uns innerhalb von 24 Stunden.
Kostenlosen Maturity Check starten →