Klassenungleichgewicht

Definition

Klassenungleichgewicht (englisch: Imbalanced Data) beschreibt ein Problem in Machine Learning, bei dem die Zielklassen in einem Datensatz sehr ungleich verteilt sind. Ein klassisches Beispiel: In einem Portfolio mit 100 Projekten sind 95 stabil und 5 kritisch. Ein Modell, das immer "stabil" vorhersagt, erreicht 95% Accuracy -- und ist dennoch wertlos, weil es keine einzige kritische Situation erkennt.

Das Problem ist weit verbreitet. Kreditkartenbetrug (0,1% aller Transaktionen), Maschinenausfälle (2% aller Geräte), Projekteskalationen (5% aller Projekte) -- in allen Fällen ist die Minderheitenklasse die eigentlich interessante, aber statistisch unterrepraesentiert.

Ben Kraiem et al. (2023) hatten ein ähnliches Problem: 61 Traditional-Projekte vs. 38 Agile-Projekte. Ohne Gegenmaßnahmen haette das Modell systematisch Traditional bevorzugt -- unabhaengig von den tatsaechlichen Projektmerkmalen.

Warum es wichtig ist

Klassenungleichgewicht führt zu drei praktischen Problemen:

Accuracy-Paradoxon -- Hohe Gesamtgenauigkeit tauscht über schlechte Erkennung der Minderheitenklasse hinweg. Ein Modell mit 95% Accuracy kann 0% der kritischen Fälle finden.
Verzerrte Entscheidungsgrenzen -- Der Algorithmus optimiert für die Mehrheitsklasse, weil dort der groesste Fehlerreduktionspotenzial liegt. Die Minderheitsklasse wird ignoriert.
Fehlende Generalisierung -- Das Modell lernt keine robusten Muster für die Minderheitsklasse, weil es zu wenige Beispiele dafür gesehen hat.

Die Lösungen sind vielfaeltig: SMOTE (synthetische Datenerzeugung), Kosten-sensitive Lernverfahren (höhere Strafe für Fehler bei der Minderheitsklasse), oder einfach die Wahl der richtigen Evaluationsmetriken (Precision, Recall, F1-Score statt Accuracy).

Aversight und Klassenungleichgewicht

Aversight begegnet dem Klassenungleichgewicht auf drei Ebenen: Erstens durch kosten-sensitives Lernen -- ein verpasster Budget-Alert wird staerker gewichtet als ein falscher Alarm. Zweitens durch dynamische Threshold-Anpassung: Wenn die Eskalationsrate in einem Quartal steigt, senkt das System den Alert-Threshold automatisch. Drittens durch kontinuierliches Retraining: Jedes neue Eskalations-Event fliest sofort in das Modell ein, sodass die Minderheitsklasse stetig wächst und besser gelernt wird.

Definition

Warum es wichtig ist

Aversight und Klassenungleichgewicht

Verwandte Begriffe

Risk Intelligence ist kein Black Box. Lassen Sie uns zeigen, wie sie funktioniert.

Klassenungleichgewicht

Definition

Warum es wichtig ist

Aversight und Klassenungleichgewicht

Verwandte Begriffe

Verwandte Inhalte

Risk Intelligence ist kein Black Box. Lassen Sie uns zeigen, wie sie funktioniert.