ETL-Strecke

Was ist eine ETL-Strecke?

ETL steht für die Extraktion, die Transformation und das Laden von Daten. Häufig wird der Begriff im Kontext von Business Intelligence verwendet und beschreibt das Ziel, bestimmte Daten aus der Produktivumgebung in ein Business Intelligence-System einzubringen.

Genauer bedeutet ETL folgendes:

  • Extraktion von Daten aus Produktivanwendungen und Datenbanken (CRM, ERP, MES, SQL, etc.)
  • Transformation der Daten, um eine einheitliche Sicht über die Quellsysteme zu erhalten, Berechnungen und Datenbereinigung durchzuführen. Des Weiteren können die Daten durch zusätzliche Informationen angereichert werden.
  • Load der Daten in unterschiedlichen Anwendungen, Datenbanken oder Files. Wie zum Beispiel in Data Marts, Data Warehouse und oder in Cubes.

ETL-Strecken können selbst entwickelt und programmiert werden oder man nutzt Tools, die beim Aufbau einer ETL-Strecke unterstützen. Bei uns im Unternehmen werden hauptsächlich die Tools Pentaho und Alteryx verwendet, mit denen einfache und auch komplexe ETL-Strecken aufgebaut werden können. Allgemein zusammengefasst ist eine ETL-Strecke ein Prozess, bei dem Daten aus mehreren, gegebenenfalls unterschiedlich strukturierten Datenquellen, in einer Zieldatenbank oder Datei vereinigt werden. Ein Ziel solch einer ETL-Strecke kann sein, große Datenmengen aus mehreren operationalen Datenbanken zu konsolidieren, um diese dann in einem Data Warehouse oder in Data Marts zu speichern.