Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Knowledge Base O nás Spolupráce Kariéra
Pojďme to probrat

Batch vs stream processing — jak zvolit správný přístup

01. 01. 2024 1 min čtení intermediate

Batch a stream processing jsou dva fundamentální přístupy. Batch v dávkách, stream v reálném čase. Správná volba závisí na latenci a komplexitě.

Batch vs Stream

Batch processing

  • Periodické — hourly, daily
  • Vysoký throughput
  • Jednodušší logika
  • Nástroje: Spark, dbt, Airflow

Stream processing

  • Průběžné — event by event
  • Nízká latence
  • Komplexnější — windowing, state
  • Nástroje: Kafka, Flink

Rozhodovací kritéria

  • Latence <1 min → stream
  • Latence hodiny/dny → batch
  • Komplexní transformace → batch jednodušší
  • Event-driven akce → stream

Shrnutí

Většina organizací kombinuje oba přístupy — batch pro analytiku, stream pro operační use cases.

batchstreamarchitekturalatence