Klassifizierung
Bei der Klassifizierung geht es darum, Objekte anhand ihrer Eigenschaften in Kategorien / Klassen einzuteilen. Hierbei unterscheiden wir die folgenden Arten von Klassifizierungsproblemen:
-
Bei der binären Klassifizierung geht es darum, Objekte in eine von zwei möglichen Klassen einzuteilen. Wollen wir z.B. erkennen, ob eine Person eine bestimmte Krankheit hat oder nicht, so stehen wir vor einem binären Klassifizierungsproblem.
-
Im Gegensatz dazu geht es bei der Multiklassen-Klassifizierung darum, ein Objekt in eine von drei oder mehr Klassen einzuteilen. Versucht man beispielsweise Bildern von Äpfeln, Birnen und Orangen jeweils den Namen der korrekten Frucht zuzuordnen, so steht man vor einem Multiklassen-Klassifizierungsproblem.
-
Bei der Multilabel-Klassifizierung ist die Aufgabe, einem Objekt eine Untermenge aus einer Menge potenzieller Labels zuzuweisen. Beispielsweise könnte die Labelmenge aus möglichen Themengebieten von Zeitungsartikeln (z.B. Politik, Wirtschaft) bestehen und ein Zeitungsartikel kann sich auch gleichzeitig mit Politik und Wirtschaft beschäftigen. Bei der Multilabel-Klassifizierung handelt es sich also im Grunde um mehrere binäre Klassifizierungen, die zusammengenommen den Multilabel Output repräsentieren. Der Output ist also mehrdimensional, was das Erkennen und Ausnutzen von Zusammenhängen zwischen den einzelnen Output-Komponenten (Labels) ermöglicht.
-
Bei der Multiklassen-Multioutput-Klassifizierung betrachtet man wie bei der Multilabel-Klassifizierung mehrere Klassifizierungsprobleme zusammen, wobei die einzelnen Klassifizierungsprobleme hierbei im Gegensatz zur Multilabel-Klassifizierung auch Multiklassen-Klassifizierungsprobleme sein können.
Es ist wichtig, die binäre Klassifizierung von der Multiklassen-Klassifizierung abzugrenzen, da einige Klassifizierungsverfahren speziell für Problem mit nur zwei möglichen Klassen entwickelt wurden und deshalb nicht ohne Weiteres für die Multiklassen-Klassifizierung verwendet werden können. Die nachfolgende Tabelle fasst noch einmal die eben eingeführten Begriffe zusammen.
Name | Anzahl der Klassifizierungen | Anzahl der Klassen pro Klassifizierung |
---|---|---|
Binäre Klassifizierung | 1 | 2 |
Multiklassen-Klassifizierung | 1 | > 2 |
Multilabel-Klassifizierung | > 1 | 2 |
Multiklassen-Multioutput-Klassifizierung | > 1 | 2 oder > 2 |