Machine Learning

Definition von Machine Learning Sebastian Heinz
15. November 2018 |  215  0
Sebastian Heinz

Machine Learning (zu deutsch: maschinelles Lernen) ist eine Form angewandter Mathematik und Informatik, bei der Computerprogramme versuchen, Muster und Zusammenhänge in Daten zu erlernen.

Im Gegensatz zu einfacheren Computerprogrammen können Machine Learning-Algorithmen die Regeln und Zusammenhänge in den Daten eigenständig erkennen, erlernen und modellieren und bei Bedarf auf neue Daten anwenden. Viele Machine Learning-Algorithmen orientieren sich in der Art und Weise, wie Informationen, Muster und Zusammenhänge aus Daten erlernt werden, an der menschlichen, iterativ orientierten Art und Weise zu lernen. Hierbei geht der Algorithmus im Wesentlichen so vor, dass er Muster in den zur Verfügung stehenden Daten erkennt und diese Erkenntnisse in Form von Parametern in sich abspeichert, um eine Antwort auf das Problem zu finden.

Obwohl im Machine Learning auch mathematische Modelle der Statistik Anwendung finden können, unterscheiden sich die beiden Disziplinen doch fundamental. Im Gegensatz zur eng verwandten Disziplin der Statistik spielt beim Machine Learning nicht die Analyse von Ursache-Wirkungs-Mechanismen, sondern die möglichst zielgenaue Prognose eines Zielkriteriums die zentrale Rolle. So möchte man zum Beispiel, dass ein Smartphone möglichst gut darin ist, das Gesicht des Benutzers korrekt zu erkennen. Weniger von Interesse ist jedoch, woran genau der Algorithmus die Entscheidung festmacht bzw. wie sicher er sich bei seiner Entscheidung ist.

Das Feld des maschinellen Lernens lässt sich in drei große Unterbereiche einteilen:

Supervised Learning

Beim Supervised Learning versucht der Algorithmus, eine vorgegebene Zielgröße in den vorhandenen Daten möglichst genau anhand anderer Datenpunkte vorherzusagen. Ein Beispiel hierfür ist die Vorhersage des Produktabsatzes gegeben des Preises, des Marktanteils sowie weiterer erhältlicher und inhaltlich relevanter Daten. Das Lernen wird als überwacht bezeichnet, da jederzeit die Abweichung zwischen den Prognosen des Modells und den tatsächlich beobachteten Daten berechnet werden kann.

Unsupervised Learning

Beim Unsupervised Learning hingegen erhält der Algorithmus eine solche Zielgröße nicht. Die Aufgabe besteht darin, die Datengrundlage möglichst gut zu erlernen, um gewisse Muster, wie z.B. homogene Gruppierungen in den Daten zu erkennen. Diese Art des Lernens wird zum Beispiel bei der Kundensegmentierung angewendet, bei dem der Algorithmus einen Weg finden soll, möglichst aussagekräftige Kundengruppen zu identifizieren, ohne dass diese vom Menschen explizit vorgegeben werden. Die genaue Anzahl der Kundengruppen ist a-priori nicht bekannt und soll vom Algorithmus identifiziert werden.

Reinforcement Learning

Der letzte, aktuell immer wichtiger werdende Bereich des maschinellen Lernens, ist das sog. Reinforcement Learning. Hierbei befindet sich der Machine Learning-Algorithmus (hier genannt: Agent) nicht mehr in einem statischen Szenario, sondern lernt seine Prognosen basierend auf dem Feedback seiner Umgebung (hier genannt: Environment / Umgebung) sukzessive zu adaptieren. In der Regel werden die Prognosen des Algorithmus in Form von Handlungen (Actions) modelliert, die es dem Agenten ermöglichen, sich in seiner Umgebung durch die Wahl seiner Handlungen zu „bewegen“. Reinforcement Learning besitzt, gegenüber Supervised und Unsupervised Learning, inhaltlich deutlich stärkere Schnittmengen zum Bereich „Künstliche Intelligenz“. Mittels Reinforcement Learning lernen bspw. Roboter sich autonom in ihrer Umgebung zu bewegen.