Cloud & Platform Engineering
Infrastruktura jako kód. Platforma jako produkt.
Stavíme cloud infrastrukturu a interní platformy, které dávají vývojářům superschopnosti — a operations klid.
Cloud migrace
Assessment, risk mapping, dependency analýza. Migrace bez výpadků, ne 'přesuneme to za víkend'.
Infrastructure as Code
Terraform, Pulumi, GitOps. Infrastruktura verzovaná, testovaná, reprodukovatelná.
Kubernetes & kontejnery
AKS, EKS, GKE. Helm, ArgoCD, progressive delivery. Od dev po produkci.
CI/CD Pipeline
GitHub Actions, GitLab CI. Commit → deploy za minuty, ne dny.
Observability & SRE
Grafana, Prometheus, Loki, Jaeger. SLO/SLI, error budgets, runbooky.
FinOps
Cloud cost optimization. Víte kolik platíte za jednotku práce, ne za idle resources.
Platform Engineering
Vybudování interní platformy, která vývojářům poskytuje standardní šablony služeb, jednotné logování, metriky, tracing, self-service prostředí a guardrails pro bezpečnost i náklady.
- ✓ Self-service pro vývojáře (deploy bez ops tiketu)
- ✓ Golden paths — standardní šablony služeb
- ✓ Guardrails pro security a cost
- ✓ DORA metriky jako feedback loop
Kdy potřebujete platform engineering¶
Typické situace¶
- „Chceme do cloudu” bez strategie — Lift & shift za trojnásobek nákladů se stejnými problémy.
- Release bolí — Manuální deploy, strach z pátečních releasů, rollbacky přes SSH.
- Snowflake servery — Servery konfigurované ručně, nikdo neví jak je reprodukovat.
- Cloud cost bez kontroly — Překvapivé účty na konci měsíce, žádná visibility.
Migrační postup¶
Z on-prem do cloudu bez výpadků — 5 kroků:
- Stabilizace & měření — Baseline metriky, SLA audit, dependency mapping.
- Hybrid období — Dual-run, nová infrastruktura běží paralelně.
- Postupné přepínání — Traffic shifting, canary releases s možností rollbacku.
- Konsolidace — Decommission starého prostředí, cost optimization.
- Provozní zralost — SRE procesy, runbooky, incident management.
DORA metriky¶
Měříme to, co doopravdy záleží:
- Deployment frequency — Kolikrát denně deployujete
- Lead time for changes — Od commitu po produkci za minuty
- Change failure rate — S guardrails pod 5%
- MTTR — Z hodin na minuty díky observability
Stack¶
Azure, AWS, GCP, Terraform, Pulumi, Kubernetes, Docker, Helm, ArgoCD, GitHub Actions, GitLab CI/CD, Grafana, Prometheus, Loki, Jaeger, Ansible, Vault, Istio/Linkerd.
Časté otázky
Záleží na kontextu. Azure je silný v enterprise a Microsoft ekosystému. AWS má nejširší nabídku. GCP vyniká v datech a ML. Pomůžeme vybrat a minimalizovat vendor lock-in.
Jednoduchá migrace: 4–8 týdnů. Komplexní enterprise s compliance: 6–12 měsíců. Migrujeme iterativně — první služba běží v cloudu za týdny.
Ne vždy. Pro jednoduchou aplikaci stačí App Service nebo Lambda. Kubernetes dává smysl při 5+ microservices, potřebě multi-cloud nebo specifických provozních požadavcích.
Typicky 30-50% oproti neoptimalizovanému stavu. Reserved instances, right-sizing, spot instances, automatický scaling. FinOps jako kontinuální proces.