Aktueller Channel Fokus:

IT-Fachkräfte-Recruitment

Informatica-Tagesgeschäft

ETL-Prozess wird zur „Datenintegration“

| Autor: Dr. Stefan Riedl

Das ETL-Prinzip: Bevor die Daten von System B geladen werden, müssen sie passend für System B transformiert werden, nachdem sie aus System A extrahiert wurden.
Das ETL-Prinzip: Bevor die Daten von System B geladen werden, müssen sie passend für System B transformiert werden, nachdem sie aus System A extrahiert wurden. (Bild: mspoint - stock.adobe.com)

ETL-Prozesse (Extraktion, Transformation und Laden von Daten) wurden früher häufig Batch-orientiert in der Nacht durchgeführt. Heutzutage klingt der Begriff fast schon antiquiert, denn es ist vielmehr von Datenintegration die Rede, erläutert der DACH-Chef von Informatica.

Als Informatica vor 26 Jahren gegründet wurde, ging es vor allem darum, bei Großkunden mit Großrechnern Daten aus Silos zu extrahieren, um sie weiterverwenden zu können. „Das hatte viel mit Schnittstellenarbeit zu tun. Stellen Sie sich beispiels­weise ein System auf einem Mainframe vor, das Logistikprozesse abwickelt. Um die Daten dort rauszubringen, um sie in einem Finanzbuchhaltungs- oder Reporting-System verwenden zu können, wurden im Hintergrund automatisiert Schnittstellen programmiert“, führt Oliver Schröder, ­Geschäftsführer DACH, Informatica aus. Offene Schnittstellenstandards wie heute gab es nicht, sodass eigene Datenbewegungsschnittstellen geschaffen werden mussten. Die Grundidee des ETL-Prinzips, also Extraktion, Transformation und Laden von Daten, stammt vor diesem Hintergrund aus dem Hause Informatica, sagt der DACH-Chef. „Auch wenn die Begrifflichkeit von Gartner und anderen Analysten geprägt wurde.“ Daten-Extraktion (aus System A), Transformation (für System B) und Laden von Daten (durch System B) wurde oft in der Nacht laufen gelassen.

ETL klingt fast schon antiquiert

Auch Realtime-Zugriffe waren damals noch kein Thema, und insgesamt klingt der Begriff ETL fast schon antiquiert, wenngleich er Informatik-Basiswissen darstellt. Heute ist von Datenintegration die Rede, unabhängig davon, ob es um den Austausch von Daten über offene Schnittstellen über Systemgrenzen von beispielsweise Salesforce-, Oracle- oder IBM-Lösungen hinweg geht, oder darum, Daten zwischen On-Premises- und Cloud-Welten zu verschieben.

Immens an Bedeutung gewann das Thema „Datenqualitätsmanagement“. Einmal auf Ebene der Speicherarchitektur, also bei der Frage, wo die Daten liegen und ob sie dort korrekt platziert sind. Andererseits bei der Frage, inwieweit die Daten inhaltlich richtig sind. „Ob beispielsweise eine hinterlegte Kreditkartennummer im Hinblick auf die Prüfziffer in sich schlüssig ist, ist eine Frage aus diesem Bereich. Oder die Frage, ob bei einem Betrag ein Wort steht oder andersherum. Beim Thema Stammdatenmanagement spielt die Dubletten-Problematik eine zentrale Rolle“, so Schröder. Hier Ordnung herzustellen ist eine Aufgabe von Master Data Management.

Alte und neue Probleme

Ein fast überall auftauchendes Problem in dem Kontext sei, dass dieselben Kunden in mehreren Systemen hinterlegt sind, beispielsweise einmal als Angebotskunde bei Salesforce und einmal als Rechnungskunde im SAP. Andere Problemstellungen durch Digitale Transformation sind in jeder Branche einzigartig. Schröder nennt Ebenen, auf denen sie auftauchen: Cloud/Hybrid, Next Gen Analytics, 360 Engagement und Data Governance/ Compliance. Die technologische Herausforderung dabei ist die, „mit Daten aus klassischen relationalen Datenbanken, Filesystem-basiert abgelegten Daten und Big-Data-Formaten, wie sie für Hadoop-Systeme gebraucht werden, gleichermaßen umgehen zu können“. Das sei alles andere als trivial, so der Informatica-Chef. All diese Themen würden nun sukzessive von Großkunden – wie zur Informatica-Anfangszeit – runter in mittelständische Unternehmen wandern, die ihr Business digitalisieren.

Partnerstrategie wird angepasst

Der Governance-Aspekt sei inzwischen ein ganz wesentlicher Treiber dafür, dass sich mehr und mehr Unternehmen mit dem Thema Datenmanagement beschäftigen: „Ob es darum geht, Daten über Transportwege für den Lieferkettennachweis ordnungsgemäß zu sammeln oder um die ­DSGVO-Thematik. Basel III und das kommende Basel IV spielen hier auch mit rein“, berichtet der Daten-Profi.

„Vor dem Hintergrund dieser Entwicklungen ändert sich unsere Partnerstrategie“, verrät der Informatica-Chef. Die Anzahl der Partner soll steigen und Informatica sucht Value Added Reseller, die tief in ihrer Branche verwurzelt sind. Ein typischer Kandidat für einen künftigen Informatica-VAR hat direkten Kundenzugang, beispielsweise mit ERP- oder DRM-Bezug. Die Themen Datenintegration, Datenqualität und Stammdatenmanagement kommen dann automatisch hinzu.

Kommentare werden geladen....

Sie wollen diesen Beitrag kommentieren? Schreiben Sie uns hier

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45837639 / Software)