Data Mapping

Definition von Data Mapping Pierre Bautz
18. November 2019 |  263  0
Pierre Bautz

Jedes Unternehmen verfügt über unzählige Daten in unterschiedlichsten Quellen oder Datensilos . Wann immer Daten aus zwei oder mehr Quellen zusammengeführt werden sollen, wird ein Data Mapping notwendig. Dieses Mapping bildet den Datenfluss zwischen den Quellen mit ihren spezifischen Datenmodellen ab und ist die Basis für ein effizientes Datenmanagement.

Data Mapping eCommerce

Vom Lieferantendatenblatt über das Warenwirtschaftssystem bis hin zur Produktdatenbank: Die darin enthaltenen Daten unterscheiden sich nicht nur in Format (CSV, XML oder SQL-Datenbank), sondern oft auch in Sprache und Intention. Im ersten Schritt werden die Datenmodelle der Quellen miteinander verknüpft. Ein einfaches Beispiel: Im Einkaufsrechner befindet sich die Farbe eines Produkts im Feld „Color“, in der Produktdatenbank heißt dieses Feld „Farbe“.  Beide Felder können in einem Mapping Tool mithilfe graphischer Werkzeuge verbunden werden. Daraus ergibt sich ein Algorithmus, so dass dieser Prozess einmalig und nicht fortlaufend anfällt.

Datentransformation

Im Zuge eines Mappings können auch Regeln zur Datentransformation festgelegt werden. Bei der Datentransformation werden Werte übersetzt: Während der Einkauf die Farbbezeichnung „B028“ für seine Bestellung benötigt, soll die Farbe im Shop mit „Hellblau“ bezeichnet werden. Der Farbfilter eines Markplatzes hingegen kennt nur den Vorgabewert „Blau“. Selbiges funktioniert auch mit Schreibweisen, Maßeinheiten etc.

Datenvalidierung

Weil Daten in verschiedenen Systemen von unterschiedlicher Bedeutung sind, schleichen sich häufig Fehler in die Datenbestände. Bei einer Datenvalidierung können Dubletten bereinigt, Daten aus einer bestimmten Quelle priorisiert und Hierarchien zwischen Artikeln und Produkten festgelegt werden. Dies ist die Grundlage dafür, um Daten in kontinuierlich hoher Qualität in alle Richtungen auszuspielen.

Das Ziel des Datenmappings ist es, Datenquellen automatisiert miteinander „kommunizieren“ zu lassen und Daten aus ihren Silos zu befreien. Ein sauberer Datenfluss und umfangreiche Datenfeeds sind in der Regel die Grundlage für die weitere Automatisierung im Produktdatenmanagement ( siehe Natural Language Generation )