Machine Learning

Machine Learning (deutsch: maschinelles Lernen) bezeichnet einen Teilbereich der Künstlichen Intelligenz. Computersysteme erkennen dabei aus Daten eigenständig Muster und leiten Regeln ab – ohne für jede Aufgabe explizit programmiert zu werden. Das Verfahren basiert auf statistischen Modellen und Optimierungsalgorithmen, die auf Trainingsdaten angewendet werden.

Grundprinzip und Funktionsweise von Machine Learning

Im Kern unterscheidet sich Machine Learning vom klassischen Programmieren. Beim klassischen Ansatz steuern feste, vom Menschen geschriebene Regeln das System. Beim maschinellen Lernen hingegen leitet der Algorithmus diese Regeln selbst aus Beispieldaten ab. Er erhält eine Menge von Trainingsdaten – etwa Bilder, Texte oder Messwerte – erkennt darin statistische Zusammenhänge und erstellt daraus ein Modell. Dieses Modell kann anschließend auf neue, unbekannte Daten angewendet werden.^[1]

Der Lernprozess gliedert sich in drei Phasen. Erstens die Datenvorbereitung: Rohdaten werden bereinigt, normiert und strukturiert. Zweitens das Training: Der Algorithmus trifft wiederholt Vorhersagen und passt seine internen Parameter anhand des Fehlers an. Drittens die Validierung und der Einsatz: Das fertige Modell wird auf neuen Daten getestet und in Produktivsystemen eingesetzt.

Machine Learning im Überblick: Lernparadigmen

Die Fachliteratur unterscheidet drei grundlegende Lernparadigmen. Sie bestimmen, wie ein Algorithmus mit den verfügbaren Daten umgeht:

Überwachtes Lernen (Supervised Learning): Das Modell wird mit beschrifteten Datensätzen trainiert. Jedem Eingabewert ist ein bekannter Ausgabewert zugeordnet. Typische Aufgaben sind Klassifikation (z. B. Spam-Erkennung) und Regression (z. B. Preisprognose).
Unüberwachtes Lernen (Unsupervised Learning): Das System erhält unbeschriftete Daten und sucht eigenständig nach Strukturen oder Gruppen. Clustering-Verfahren wie k-Means sind ein typisches Beispiel.
Bestärkendes Lernen (Reinforcement Learning): Ein Agent interagiert mit einer Umgebung und erhält Belohnungen oder Strafen für seine Aktionen. Er optimiert seine Strategie schrittweise, um den kumulierten Gewinn zu maximieren.

Jedes Paradigma eignet sich für unterschiedliche Problemstellungen. Die Qualität und Menge der verfügbaren Daten ist dabei jeweils entscheidend.

Wichtige Algorithmen und Modellklassen

Das Feld des maschinellen Lernens umfasst eine Vielzahl etablierter Algorithmen. Die Wahl hängt von der jeweiligen Aufgabenstellung ab. Zu den bekanntesten zählen:

Entscheidungsbäume (Decision Trees): Baumförmige Modelle, die Daten anhand von Regeln in Klassen einteilen. Sie sind gut interpretierbar, neigen jedoch bei komplexen Daten zu Überanpassung (Overfitting).
Random Forests: Ein Ensemble vieler Entscheidungsbäume. Es liefert durch Mehrheitsentscheid robustere Vorhersagen als ein einzelner Baum.
Support Vector Machines (SVM): Das Verfahren klassifiziert Datenpunkte durch eine optimale Trennebene im mehrdimensionalen Raum.
Neuronale Netze (Neural Networks): An biologische Nervensysteme angelehnte Modelle. Sie bestehen aus Eingangs-, verdeckten und Ausgangsschichten. Tiefe Varianten mit vielen Schichten bilden die Grundlage des Deep Learning – eines eigenen Teilgebiets, das vor allem bei Bild- und Spracherkennung eingesetzt wird.
Gradient Boosting (z. B. XGBoost, LightGBM): Sequentielle Ensemble-Methoden, die schwache Lernalgorithmen sukzessive verbessern. Sie erzielen bei strukturierten Daten häufig Spitzenwerte.

Neben der Aufgabe beeinflussen auch Interpretierbarkeit, Rechenaufwand und Datenmenge die Algorithmenwahl.

Anwendungsfelder und Einsatzbereiche

Machine Learning ist heute in nahezu allen Branchen präsent. Im digitalen Marketing werden Modelle eingesetzt, um Nutzerverhalten vorherzusagen und personalisierte Inhalte auszuspielen. Auch bei psychografischen Targetings helfen sie, Zielgruppen präziser anzusprechen. Empfehlungssysteme – wie im Bereich Recommendations beschrieben – nutzen Kollaboratives Filtern und inhaltsbasierte Verfahren. Sie schlagen Nutzern relevante Produkte oder Inhalte vor.^[2]

In der Industrie ermöglicht maschinelles Lernen vorausschauende Wartung (Predictive Maintenance). Sensordaten von Maschinen werden kontinuierlich analysiert. So lassen sich Ausfälle frühzeitig erkennen und kostspielige Stillstände vermeiden. Im Finanzwesen werden Kreditrisiken bewertet, Betrug erkannt und Kursbewegungen prognostiziert. Im Gesundheitswesen unterstützen Modelle die Bilddiagnostik, etwa bei der Auswertung von Röntgen- oder MRT-Aufnahmen.

Im Bereich der Prozessautomatisierung ergänzt maschinelles Lernen regelbasierte Ansätze wie Robotic Process Automation. Es macht unstrukturierte Daten, etwa handgeschriebene Formulare oder E-Mails, interpretierbar. In der IT-Sicherheit kommt es bei der Bot Detection zum Einsatz: Modelle unterscheiden zwischen menschlichem und automatisiertem Datenverkehr.

Voraussetzungen, Grenzen und kritische Aspekte

Die Leistungsfähigkeit eines Machine-Learning-Modells hängt maßgeblich von der Qualität der Trainingsdaten ab. Fehlerhafte oder verzerrte Datensätze führen zu Modellen, die systematische Fehler reproduzieren. Dieses Phänomen wird in der Forschung als Bias bezeichnet. Modelle, die auf historischen Personaldaten trainiert wurden, können bestehende Diskriminierungsmuster verstärken.^[3]

Ein weiteres strukturelles Problem ist die Black Box-Problematik. Komplexe Modelle wie tiefe neuronale Netze treffen Entscheidungen, die für Menschen nur schwer nachzuvollziehen sind. Das steht im Konflikt mit der EU-Datenschutz-Grundverordnung (DSGVO), die ein Recht auf Erklärung automatisierter Entscheidungen vorsieht. Das Forschungsfeld der Explainable AI (XAI) adressiert genau diese Herausforderung.

Hinzu kommen hohe Rechenanforderungen beim Training großer Modelle. Außerdem besteht die Gefahr der Überanpassung (Overfitting): Ein zu stark auf Trainingsdaten optimiertes Modell verliert die Fähigkeit zur Verallgemeinerung auf neue Daten.

Abgrenzung zu verwandten Konzepten

Machine Learning ist kein Synonym für Künstliche Intelligenz, sondern ein Teilgebiet davon. KI umfasst auch regelbasierte Expertensysteme und symbolische Verfahren, die ohne Lernen aus Daten auskommen. Deep Learning wiederum ist ein Teilgebiet des maschinellen Lernens. Es bezeichnet mehrschichtige neuronale Netze, die komplexe Muster in großen Datenmengen erkennen.

Begriff	Einordnung	Charakteristikum
Künstliche Intelligenz (KI)	Oberbegriff	Simulation menschlicher Intelligenz durch Maschinen
Machine Learning	Teilgebiet der KI	Lernen aus Daten ohne explizite Programmierung
Deep Learning	Teilgebiet des ML	Mehrschichtige neuronale Netze für komplexe Muster
Data Mining	Verwandtes Verfahren	Wissensextraktion aus großen Datenbeständen

Data Mining bezeichnet die Extraktion von Mustern aus großen Datensätzen. Es nutzt häufig ML-Algorithmen als Werkzeug, ist jedoch stärker auf explorative Analyse ausgerichtet als auf vorhersagefähige Modelle.

Historische Entwicklung

Die theoretischen Grundlagen des maschinellen Lernens reichen in die 1940er und 1950er Jahre zurück. Alan Turing stellte 1950 in seinem Aufsatz „Computing Machinery and Intelligence“ die Frage, ob Maschinen denken können. Der Begriff „Machine Learning“ selbst wurde 1959 von Arthur Samuel geprägt. Er arbeitete bei IBM an lernfähigen Schachprogrammen.

In den 1980er und 1990er Jahren gewann das Feld durch den Backpropagation-Algorithmus und leistungsfähigere Rechner an Dynamik. Der Durchbruch zu praktischer Relevanz gelang ab dem Jahr 2010. Damals wurden massive Datensätze verfügbar, und leistungsstarke Grafikprozessoren (GPUs) ermöglichten das Training tiefer neuronaler Netze. Seitdem wächst der Markt für Machine-Learning-Anwendungen weltweit kontinuierlich.^[4]

Literaturempfehlungen

Aurélien Géron: Praxiseinstieg Machine Learning mit Scikit-Learn, Keras und TensorFlow. O’Reilly / dpunkt.verlag, Heidelberg 2023, ISBN 9783960091240.
Christopher M. Bishop: Pattern Recognition and Machine Learning. Springer, New York 2006, ISBN 9780387310732.
Andriy Burkov: Machine Learning, kurz & gut. O’Reilly, Sebastopol 2019, ISBN 9781999579517.