Datenannotation

Definition von Datenannotation Helge Meinhold
14. Juni 2019 |  825  0
Helge Meinhold

Annotation heißt „Hinzufügung“, „Beifügung“ oder auch „Anmerkung“. Bezogen auf Daten bedeutet Datenannotation, dass wesentliche Primärdaten durch Sekundärdaten ergänzt werden. Damit sind die angefügten Informationen den Marginalien in Büchern oder den Kommentaren in Quellcodes sehr ähnlich. Sie liefern Mehrwerte als strukturierte Zusatzinformationen, ohne die Originaldaten zu verändern.  

Die Notwendigkeit, Daten zu annotieren, gibt es im Digital Commerce reichlich. Datenqualität wird immer aus der Sicht des Nutzes bewertet. Artikeldaten aus einem B2B ERP-Kontext sind in den seltensten Fällen dazu geeignet, einen B2C-Shopkunden zu überzeugen. So beschreibt beispielsweise die B2B Materialbezeichnung „LD16_SLB“ leider nicht das „weiche, dunkelbraune Spaltleder“, welches den Interessenten zum Kunden macht. In diesem Fall wäre es möglich, eine automatisierte Annotierung umzusetzen. In Fällen, die eher mit subjektiven Eigenschaften wie „Stil“ oder „Design“ arbeiten, muss dies oft manuell gelöst werden.

Immer öfter kommen KI-Systeme als Lösung für digitale Geschäftsprozesse zum Einsatz. Damit KI-Systeme/Prozesse effektiv und zielgerichtet Mehrwerte generieren, müssen sie mit Trainingsdaten spezifiziert werden. Ist die Datenbasis allerdings zu einseitig und nicht ausgewogen, wird die KI mit „Vorurteilen“, also mit schlechter Generalisierung und ohne Präzision aufgebaut. Ein neuronales Netz und ausreichend Trainingsdaten sind also kein Garant für eine effektive KI. Die Auswahl und besonders die Annotation der Daten sind für das Training einer KI daher von besonderer Bedeutung.