Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Knowledge Base O nás Spolupráce Kariéra
Pojďme to probrat

Real-time analytics — architektura pro analýzu v reálném čase

01. 01. 2024 1 min čtení intermediate

Real-time analytics umožňuje analyzovat data v momentě vzniku. Lambda vs Kappa, streaming pipeline a OLAP databáze.

Architektura

Lambda vs Kappa

Lambda — batch + speed vrstva. Kappa — pouze streaming.

# Kappa stack:
# Kafka → Flink → ClickHouse → Grafana
# 1. Kafka: příjem
# 2. Flink: enrichment, agregace
# 3. ClickHouse: sub-second dotazy
# 4. Grafana: vizualizace

OLAP enginy

  • ClickHouse — nejrychlejší agregace
  • Apache Druid — time-series
  • Apache Pinot — user-facing analytics
  • DuckDB — embedded OLAP

Metriky

  • End-to-end latence — <10s je real-time
  • Query latence — cíl <1s

Shrnutí

Kappa s Kafka + Flink + ClickHouse je dnes preferovaný stack pro real-time analytics.

real-timeanalyticslambdakappa