Algorithmen des überwachten, maschinellen Lernens basieren auf beschrifteten Trainingsdaten, denen jeweils sowohl Features (Eigenschaften) als auch Labels (Benennungen) zugeordnet sind. Das Ziel des überwachten Lernens besteht darin, einen Zusammenhang zwischen den Features und den Labels zu erlernen. Dazu wird ein mathematisches Modell basierend auf den Trainingsdaten optimiert, um dann die Labels neuer Datensätze vorhersagen zu können, sobald deren Features bekannt sind. Es gibt zwei Arten des überwachten Lernens: die Regression und die Klassifikation.
Bei der Regression trainiert man einen Algorithmus darauf, einen Wert aus einem kontinuierlichen Bereich möglicher Werte vorherzusagen.