Was ist überwachtes Lernen?

6 Mrz 2023 | Allgemein

Die Definition

Überwachtes Lernen ist ein Ansatz des maschinellen Lernens, bei dem ein Algorithmus aus einer Menge von Daten lernt, die bereits mit einer Zielvariablen (auch bekannt als Labels) versehen sind. Ziel des Algorithmus ist es, eine Funktion zu lernen, die eine Vorhersage der Zielvariable basierend auf den Eingabedaten macht. Das Ziel des überwachten Lernens besteht darin, eine möglichst genaue Vorhersage der Zielvariable für neue, unbekannte Eingabedaten zu treffen.

Zwei Herangehensweisen

Beim überwachten Lernen werden die Trainingsdaten in zwei Teile aufgeteilt: einen Teil, der zum Training des Algorithmus verwendet wird, und einen Teil, der zum Testen der Vorhersagegenauigkeit des Algorithmus verwendet wird. Der Trainingsdatensatz wird verwendet, um den Algorithmus so zu trainieren, dass er eine Vorhersage der Zielvariable macht, wenn ihm neue Eingabedaten vorgelegt werden. Der Testdatensatz wird dann verwendet, um die Vorhersagegenauigkeit des Algorithmus zu messen.

Klassifikation und Regression

Bei der Klassifikation handelt es sich um ein überwachtes Lernproblem, bei dem der Algorithmus eine Eingabe in eine bestimmte Kategorie oder Klasse einteilen muss. Zum Beispiel könnte ein Algorithmus trainiert werden, um Bilder von Tieren als „Hund“ oder „Katze“ zu klassifizieren.

Bei der Regression handelt es sich um ein überwachtes Lernproblem, bei dem der Algorithmus eine Eingabe mit einer numerischen Zielvariable in Beziehung setzt. Zum Beispiel könnte ein Algorithmus trainiert werden, um den Preis eines Hauses basierend auf seinen Eigenschaften wie Größe, Alter und Standort vorherzusagen.

Die Algorithmen

Es gibt verschiedene Algorithmen für überwachtes Lernen, wie zum Beispiel Entscheidungsbäume, neuronale Netze und Support-Vector-Maschinen (SVM). Jeder Algorithmus hat seine Stärken und Schwächen und eignet sich für verschiedene Arten von Problemen.

Überwachtes Lernen findet Anwendung in vielen Bereichen der KI, wie z.B. in der Spracherkennung, der Bilderkennung, der Datenanalyse und der Robotik. Es ermöglicht es Algorithmen, aus Erfahrung zu lernen und Vorhersagen zu treffen, die auf Daten basieren, die bereits mit Zielvariablen versehen sind.