Zum Inhalt springen
_CORE
KI & Agentensysteme Unternehmensinformationssysteme Cloud & Platform Engineering Datenplattform & Integration Sicherheit & Compliance QA, Testing & Observability IoT, Automatisierung & Robotik Mobile & Digitale Produkte Banken & Finanzen Versicherungen Öffentliche Verwaltung Verteidigung & Sicherheit Gesundheitswesen Energie & Versorgung Telko & Medien Industrie & Fertigung Logistik & E-Commerce Retail & Treueprogramme
Referenzen Technologien Blog Know-how Tools
Über uns Zusammenarbeit Karriere
CS EN DE
Lassen Sie uns sprechen

Debezium — Change Data Capture für Echtzeit-Replikation

20. 09. 2023 Aktualisiert: 27. 03. 2026 1 Min. Lesezeit intermediate
Dieser Artikel wurde veröffentlicht im Jahr 2023. Einige Informationen können veraltet sein.

Debezium erfasst Datenbankänderungen in Echtzeit. Jedes INSERT, UPDATE und DELETE wird ohne Belastung der Quelldatenbank an Kafka übertragen.

Change Data Capture

CDC liest das Transaktionslog (WAL, Binlog) — belastet die Quelldatenbank nicht.

{
  "name": "postgres-cdc",
  "config": {
    "connector.class": "io.debezium.connector.postgresql.PostgresConnector",
    "database.hostname": "postgres",
    "database.dbname": "app",
    "topic.prefix": "cdc",
    "table.include.list": "public.orders",
    "plugin.name": "pgoutput",
    "transforms": "unwrap",
    "transforms.unwrap.type": "io.debezium.transforms.ExtractNewRecordState"
  }
}

CDC → Data Lake

  • Debezium → Kafka
  • Flink/Spark → Verarbeitung
  • Delta/Iceberg/Hudi → Upsert

Best Practices fuer die Produktion

Verwenden Sie Debezium in Produktionsumgebungen mit Kafka Connect im verteilten Modus fuer Hochverfuegbarkeit. Setzen Sie snapshot.mode nach Bedarf — initial fuer die erste vollstaendige Datenbanksynchronisation, schema_only wenn Sie nur neue Aenderungen benoetigen. Die ExtractNewRecordState-Transformation vereinfacht die Nachrichtenstruktur vom Envelope-Format zu flachem JSON.

Ueberwachen Sie den Lag zwischen Quelldatenbank und Kafka-Topics mit Debezium-Metriken. Bei Performance-Problemen erwaegen Sie Spaltenfilterung mit column.include.list — uebertragen Sie nur die Daten, die Sie tatsaechlich benoetigen. Seien Sie vorsichtig bei Schema-Migrationen — ALTER TABLE auf der Quell-DB erfordert einen Neustart des Connectors mit dem neuen Schema. Debezium unterstuetzt PostgreSQL, MySQL, MongoDB, SQL Server, Oracle und weitere Datenbanken.

Zusammenfassung

Debezium ist der Standard für CDC im Kafka-Ökosystem. Nahezu Echtzeit-Replikation ohne Belastung der Quelldatenbank.

debeziumcdcReplikationkafka connect
Teilen:

CORE SYSTEMS Team

Wir bauen Kernsysteme und KI-Agenten, die den Betrieb am Laufen halten. 15 Jahre Erfahrung mit Enterprise-IT.