Zum Inhalt springen
_CORE
KI & Agentensysteme Unternehmensinformationssysteme Cloud & Platform Engineering Datenplattform & Integration Sicherheit & Compliance QA, Testing & Observability IoT, Automatisierung & Robotik Mobile & Digitale Produkte Banken & Finanzen Versicherungen Öffentliche Verwaltung Verteidigung & Sicherheit Gesundheitswesen Energie & Versorgung Telko & Medien Industrie & Fertigung Logistik & E-Commerce Retail & Treueprogramme
Referenzen Technologien Blog Know-how Tools
Über uns Zusammenarbeit Karriere
CS EN DE
Lassen Sie uns sprechen

Kubernetes Autoscaling in der Praxis — HPA, VPA und Cluster Autoscaler

15. 09. 2020 Aktualisiert: 27. 03. 2026 1 Min. Lesezeit CORE SYSTEMSai
Dieser Artikel wurde veröffentlicht im Jahr 2020. Einige Informationen können veraltet sein.
Kubernetes Autoscaling in der Praxis — HPA, VPA und Cluster Autoscaler

Kubernetes kann skalieren. Aber Autoscaling richtig zu konfigurieren, damit es auf reale Last reagiert, keine Ressourcen verschwendet und unter Spitzenlast nicht zusammenbricht — das ist eine Kunst.

Drei Ebenen des Autoscalings

  • HPA — fügt Pods hinzu/entfernt sie (für Stateless Services)
  • VPA — ändert CPU/RAM-Limits von Pods (für Monolithen)
  • Cluster Autoscaler — fügt Nodes hinzu/entfernt sie

Custom Metriken statt CPU

Standard-HPA skaliert nach CPU, aber das reicht nicht. Über den Prometheus Adapter haben wir Requests/sec, Latenz p95 und Queue Depth hinzugefügt. Jetzt skaliert HPA auf Basis dessen, was wirklich zählt.

Overprovisioning für schnelles Scale-Up

Ein neuer AKS-Node braucht 3–5 Minuten. Lösung: Wir halten einen „leeren” Node mit Pause-Containern vor, sofort verfügbar für reale Workloads. Der Cluster Autoscaler fügt einen neuen Node im Hintergrund hinzu.

Spot Instances — 60–80% Ersparnis

Für fehlertolerante Workloads (Batch, CI/CD, Dev) nutzen wir Azure Spot VMs in einem dedizierten Node Pool. Produktion immer auf On-Demand.

Größter Fehler: Falsche Resource Requests

Entwickler setzten 2 CPU und 4 GB RAM „zur Sicherheit”. Reale Auslastung 15%. Der Cluster Autoscaler fügte unnötig Nodes hinzu. Lösung: VPA im Recommendation Mode.

Autoscaling erfordert Investition

Es ist kein „einrichten und vergessen”. Richtige Metriken, realistische Requests und kontinuierliches Tuning — aber die Belohnung ist ein System, das Spitzen automatisch bewältigt.

kubernetesautoscalingaksdevopscloud
Teilen:

CORE SYSTEMS

Wir bauen Kernsysteme und KI-Agenten, die den Betrieb am Laufen halten. 15 Jahre Erfahrung mit Enterprise-IT.

Brauchen Sie Hilfe bei der Implementierung?

Unsere Experten helfen Ihnen bei Design, Implementierung und Betrieb. Von der Architektur bis zur Produktion.

Kontaktieren Sie uns
Brauchen Sie Hilfe bei der Implementierung? Termin vereinbaren