Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Knowledge Base O nás Spolupráce Kariéra
Pojďme to probrat

Kubernetes autoscaling v praxi — HPA, VPA a Cluster Autoscaler

15. 09. 2020 1 min čtení CORE SYSTEMSai

Kubernetes umí škálovat. Ale správně nakonfigurovat autoscaling tak, aby reagoval na reálnou zátěž, neplýtval zdroji a nezkolaboval pod špičkou — to je umění.

Tři vrstvy autoscalingu

  • HPA — přidává/odebírá pody (pro stateless služby)
  • VPA — mění CPU/RAM limity podů (pro monolity)
  • Cluster Autoscaler — přidává/odebírá nody

Custom metriky místo CPU

Výchozí HPA škáluje podle CPU, ale to nestačí. Přes Prometheus Adapter jsme přidali requests/sec, latency p95 a queue depth. Teď HPA škáluje na základě toho, co opravdu záleží.

Overprovisioning pro rychlý scale-up

Nový AKS node trvá 3-5 minut. Řešení: udržujeme „prázdný” node s pause containery, okamžitě k dispozici pro reálné workloady. Cluster Autoscaler přidá nový node na pozadí.

Spot instances — úspora 60-80 %

Pro fault-tolerant workloady (batch, CI/CD, dev) používáme Azure Spot VMs v dedikovaném node poolu. Produkce vždy na on-demand.

Největší chyba: špatné resource requests

Vývojáři nastavili 2 CPU a 4 GB RAM „pro jistotu”. Reálná utilizace 15 %. Cluster Autoscaler přidával nody zbytečně. Řešení: VPA v recommendation mode.

Autoscaling vyžaduje investici

Není to „zapni a zapomeň”. Správné metriky, realistické requests a průběžné ladění — ale odměna je systém, který zvládne špičky automaticky.

kubernetesautoscalingaksdevopscloud