Datenhochzeit auf Open-Source-Basis Talend sucht Systemintegratoren für deutsche Version des ETL-Tools
Software verschenken alleine spült keinen Umsatz in die Kasse. Gemäß der Open-Source-Philosophie setzt man bei Talend auf eine breite Nutzer-Community für die ETL- und Datenqualitäts-Werkzeuge. Zusammen mit Systemintegratoren beginnt dann erst der vertriebliche Teil.
Anbieter zum Thema
Wenn es darum geht, ein Datawarehouse mit Input aus mehreren Datenquellen zu füllen, müssen die womöglich unterschiedlich strukturierten Informationen erst angeglichen werden, bevor sie in der Zieldatenbank verheiratet werden.
Dieser Prozess ist als ETL bekannt und umfasst:
- Extraktion der Daten aus verschiedenen Quellen
- Transformation der Daten in das richtige Format und Schema
- Laden der Daten in die Zieldatenbank
Helmut Kohls zum Aussortieren
Software, die das im großen Stil beherrscht (so genannte ETL-Plattformen) sind teuer, aber es gibt sie auch auf Open-Source-Basis. Darunter fallen die Werkzeuge von Talend. Das Talend-Open-Studio ist im Bereich Datenintegration, beziehungsweise ETL angesiedelt; der Talend-Open-Profiler sorgt für Datenqualität. Wenn beispielsweise in einer Adressliste Falschangaben wie etwa alle »Helmut Kohl«-Datensätze aussortiert werden sollen, hilft der Open-Profiler weiter. Ein weiteres Beispiel hierfür ist, dass in wissenschaftlichen Erhebungen nicht erhobene Felder eines Datensatzes traditionell mit Achten beziffert werden (888, 8.888). Auch hier ist mitunter eine Bereinigung nötig.
Talend ist jetzt auch in Deutschland
Open-Source-Anbieter Talend zählt weltweit inzwischen 120 Mitarbeiter. Das Venture-Capital-finanzierte Unternehmen hat 2008 auch eine Niederlassung in Nürnberg gegründet, in der inzwischen zwölf Mitarbeiter aus den Bereichen Vertrieb und Technik die DACH-Region betreuen.
Lesen Sie auf der nächsten Seite mehr zur Vererbungslehre unter GPL und zum Vertriebsansatz bei Talend
Artikelfiles und Artikellinks
(ID:2021737)