Metriky v Prometheus jsou užitečné, ale surová čísla nikomu neřeknou, jestli je systém zdravý. Grafana vizualizuje metriky v reálném čase — grafy, heatmapy, alerting. Provozní dashboard, na který se chcete dívat.
Instalace a datasources¶
Grafana běží jako Docker kontejner. Datasource: Prometheus, Elasticsearch, InfluxDB, PostgreSQL — připojíte libovolný zdroj dat. Jeden dashboard může kombinovat data z více zdrojů.
Dashboard design¶
Pravidla pro efektivní dashboardy:
- Overview first: Horní řádek — RED metriky (Rate, Errors, Duration)
- Drill-down: Kliknutí na graf → detail per service
- Variables: Dropdown pro výběr služby, environment, timerange
- Alerting: Vizuální indikátor — zelená/žlutá/červená
Template variables¶
# Prometheus query pro variable
label_values(up, job)
# Použití v panelu
rate(http_requests_total{job="$service"}[5m])
Jeden dashboard, dropdown pro výběr služby. Nemusíte vytvářet dashboard pro každou službu zvlášť.
Alerting¶
Grafana alerting nebo Prometheus Alertmanager. Pravidla: error rate > 5 %, response time p95 > 1s, disk usage > 80 %. Notifikace: Slack, email, PagerDuty.
Dashboard je okno do systému¶
Dobrý dashboard ušetří hodiny debuggingu. Investujte do designu dashboardů stejně jako do kódu. Grafana community dashboardy jsou skvělý start.