Monitoring říká „něco je špatně”. Observability říká „proč”. OpenTelemetry sjednotil metriky, logy a traces pod jedno SDK.
Náš stack¶
- OTel SDK v každé službě (Java, Python, Node.js)
- OTel Collector jako Kubernetes sidecar
- Tempo pro traces, Prometheus pro metriky, Loki pro logy
- Grafana pro korelaci — spike v metrikách → logy → trace
Auto-instrumentace¶
OTel Java Agent automaticky instrumentuje Spring Boot, JDBC, HTTP klienty, Kafka. Žádná změna kódu — jen JVM argument.
Dopad na MTTR¶
Před: 45 minut (kontrola logů každé služby zvlášť). Po: 12 minut (anomálie → korelace → trace → root cause).
Observability není luxus¶
V distribuovaném systému nemůžete ladit bez observability. Investujte teď, než řešíte incident ve 3 ráno bez dat.