Support Vector Machine (SVM)
Support Vector Machine ist ein Supervised Learning Verfahren zur Klassifikation von Daten.
Um die Datenpunkte verschiedener Klassen möglichst gut voneinander zu trennen, sucht SVM nach solchen Klassengrenzen, die einen möglichst großen Abstand zu den Datenpunkten der verschiedenen Klassen besitzen und so einen möglichst breiten Bereich um die Klassengrenze frei von Datenpunkten lassen.
Eine zentrale Idee von SVM Algorithmen ist hierbei, die Grenzen zwischen den Gruppen nur auf Basis derjenigen Datenpunkte zu bestimmen, die der anderen Gruppe und somit dann der Grenze am nähesten sind (support vectors).
Bei den Klassengrenzen arbeitet SVM zunächst mit Geraden oder Ebenen. Mit dem sogenannten Kernel-Trick, d.h. einer geschickten Datentransformation, lassen sich aber auch sehr gut komplexere, nicht-lineare Trennlinen oder -flächen finden.
Das resultierende Modell ist typischer Weise gut auf neue Daten generalisierbar und nicht sehr anfällig für Overfitting. Auf der anderen Seite können SVM Algorithmen verrauschte Daten nicht gut handhaben.
SVM kann auch zur Regression verwendet werden. Man spricht hier auch von Support Vector Regression.