Gutes Datenqualität-Management (DQM) ist der Schlüssel für dauerhaft hohe Datenqualität

Bei ITGAIN verstehen wir DQM als kontinuierliche Maßnahme. Hierzu muss ein wiederkehrender Prozess definiert und implementiert werden, in dem in mehreren Schritten Top-Down Datenqualitätsziele festgelegt und deren Umsetzung überprüft werden. Nur so kann dauerhaft hohe Datenqualität im Unternehmen sichergestellt werden.

Voraussetzung hierfür der Aufbau einer DQ-Organisation die z.B.  für die Zuordnung von Rollen, Aufgaben und Datenverantwortlichkeiten als auch die Implementierung der DQ-Prozesse im Rahmen der Ablauforganisation verantwortlich zeichnet. Dies umfasst auch die Kommunikation von DQ-Ergebnissen, das Änderung-Management sowie den Umgang mit Störungen.

Zu den wesentliche Ergebnistypen einer DQ Strategie gehören:

  • Eine Dublettensuche in großen Datenmengen
  • Eine Datenprofilierung durch Ermittlung von Ist-Analyse-Datenprofilen für alle relevanten Systeme (z.B. relationalen Datenbanken, XML Daten bis hin zu Key-Value-Datenbanken und nachrichtenbasierten Systemen  
  • Fachlichen Anforderungsaufnahme und Konzeption der DQ-Regeln, sowie deren technische Implementierung in der entsprechen Systemlandschaft
  • Eine DQ-Kennzahlenbaum für Geschäftsobjekte und Geschäftsprozesse sowie die Implementierung und die Ergebnisvisualisierung als Kennzahlen-Lineage in DQ-Werkzeugen und marktüblichen BI-Produkten.

Zusätzlich zu diesen Themen ist auch die Frage der technischen Integration der DQ-Strategie in die bestehende Systemlandschaft, die Frage ob ein zentraler oder dezentraler Ansatz gewählt wird  und die  Auswahl der geeigneter Techniken und Tools ein wesentlicher Bestandteil einer guten DQ Strategie und langfristig angelegten.

Neuen Kommentar schreiben

Ihre E-Mail Adresse wird nicht veröffentlicht.

NEUESTE BEITRÄGE

Matillion ITGAIN
15.04.2021

Matillion ETL – Datenintegration für und in der Cloud

Nick Kalbe

Seit dem ersten Entwurf des Data Warehouse Konzepts ist viel Zeit verstrichen. Neue Technologietrends und Innovationen sorgen für eine stetige Veränderung. Einer dieser Trends, der aktuell sehr hohe Aufmerksamkeit genießt, ist die Cloud. Durch das Auslagern der Infrastruktur in die Cloud versprechen sich Unternehmen Skalierbarkeit, Mobilität und die Abgabe von Aufgaben bezüglich Inhouse Servern an die Cloud-Dienstleister. Ein passendes ETL-Tool für die Cloud-Strategie zu finden ist eine große Herausforderung, weil die Palette von Cloud-fähigen ETL-Tools auf dem Markt schier unendlich ist und stetig wächst. Im Rahmen unserer Blogserie stellen wir einige Cloud-fähige ETL-Tools vor, beginnend mit Matillion ETL in diesem Artikel.

ITGAIN Snowflake
09.03.2021

Snowflake – Getting Started #1 Erstellung eines kostenlosen Testaccounts und Erklärung der UI

Ealil Birabakaran Florian Schmedes

Im Rahmen dieser Blogserie werden wir Euch Schritt-für-Schritt mit in die Wolke nehmen, damit Ihr Eure ersten eigenen Gehversuche und Erfahrungen mit Snowflake sammeln könnt.

Data Engineering
ITGAIN Snowflake
11.02.2021

(K)eine Schneeballschlacht mit Daten

Ealil Birabakaran Florian Schmedes

Die Cloud ist derzeit das Buzzword für Unternehmen, die überlegen ihre Datenbankinfrastruktur zu modernisieren oder gar ein neues Data Warehouse errichten wollen. Dabei sind die meisten noch unsicher, ob die Cloud der richtige Schritt für sie ist. Gründe können Unsicherheiten bezüglich des Datenschutzes sein, aber auch die Frage welche technischen Schritte einen erwarten, können zu einer zögerlichen Haltung führen. In unserer Blogserie wollen wir uns näher mit BI in der Cloud beschäftigen und den Leser Schritt für Schritt mit in die Wolke nehmen.

Data Engineering