OpenMetadata baut auf dem Konzept aktiver Metadaten auf — Metadaten, die Daten nicht nur beschreiben, sondern aktiv Datenprozesse und -qualitaet steuern. Im Gegensatz zu passiven Katalogen, in denen Metadaten nur der Dokumentation dienen, nutzt OpenMetadata sie fuer automatisiertes Alerting, Profiling und Governance. Kollaborative Funktionen ermoeglichen es Datenteams, direkt bei Datensaetzen zu diskutieren, Eigentuemer zuzuweisen und ein gemeinsames Business-Glossar aufzubauen.
Plattform fuer aktive Metadaten¶
Im Gegensatz zu DataHub liegt der Schwerpunkt bei OpenMetadata auf Kollaboration und aktiven Metadaten. Der eingebaute Data Profiler analysiert automatisch Verteilungen, Null-Werte und Statistiken ohne externe Tools.
Wesentliche Unterschiede¶
- Eingebauter Profiler — automatische Datenanalyse ohne externe Tools, verfolgt Verteilungen und Anomalien
- Alerting — Benachrichtigungen bei Schemaaenderungen, Qualitaetsabfall oder SLA-Verletzungen
- Konversationen — Teamdiskussionen direkt bei Datensaetzen, Spalten und Pipelines
- Glossar — Geschaeftsvokabular, das technische Metadaten mit dem Business-Kontext verbindet
Bereitstellung¶
version: "3.9"
services:
openmetadata:
image: openmetadata/server:latest
ports: ["8585:8585"]
environment:
OPENMETADATA_CLUSTER_NAME: "production"
OpenMetadata unterstuetzt Konnektoren fuer alle gaengigen Datenquellen — PostgreSQL, MySQL, BigQuery, Snowflake, Redshift, S3, Kafka und Dutzende weitere. Ingestion-Pipelines laufen als separate Workloads und koennen ueber Airflow, Dagster oder direkt aus der OpenMetadata-UI gestartet werden.
Datenqualitaet¶
Das eingebaute Test-Framework ermoeglicht die Definition von Qualitaetstests direkt im Katalog — Wertebereichsvalidierung, Null-Pruefungen, Ueberpruefung der referenziellen Integritaet. Testergebnisse sind im Datensatzprofil sichtbar und bei Fehlern werden automatisch Alerts ausgeloest. Damit werden Metadaten zu einem aktiven Teil der Daten-Pipeline.
Zusammenfassung¶
OpenMetadata ist ideal fuer Teams, die aktive Kollaboration ueber Daten wuenschen. Der eingebaute Profiler, Alerting und Konversationen eliminieren den Bedarf an externen Tools fuer grundlegende Datenqualitaet und Governance.