Ein typisches Beispiel für eine binäre Klassifikation ist das Erkennen von Spam-Mails. Dabei gibt es mit „Spam“ und „Kein Spam“ nur zwei Klassen. Will man dagegen beispielsweise handgeschriebene Ziffern erkennen, hat man es mit einem Multiklassenproblem mit zehn verschiedenen Klassen (einer pro Ziffer) zu tun.
In jedem Fall aber hat der Anwender das Ziel, sein Klassifikationsmodell anhand von vorhandenen, beschrifteten Trainingsdaten so zu trainieren, dass es auch bisher nicht gesehene und nicht im Trainingsset enthaltene Daten verlässlich der richtigen Klasse zuordnet. Es gibt eine große Zahl verschiedener Klassifikationsmodelle, angefangen bei einfachen linearen Modellen bis hin zu komplexen neuronalen Netzwerken, die anspruchsvolle Aufgaben bewältigen können.
Entscheidungsbäume
Eines der einfachsten Verfahren zur Klassifikation