Kubernetes

Kubernetes Skalierung: HPA, VPA, Cluster Autoscaler und KEDA

Kubernetes Auto-Scaling: Horizontal Pod Autoscaler (HPA), Vertical Pod Autoscaler (VPA), Cluster Autoscaler und KEDA für Event-driven Scaling.

C
CFTools Software
Autor
20. November 2025
5 min Lesezeit

Kubernetes Skalierung

Skalierungs-Ebenen

  1. Pod-Level: HPA, VPA
  2. Node-Level: Cluster Autoscaler
  3. Event-driven: KEDA

Horizontal Pod Autoscaler (HPA)

Funktionsweise

  • Überwacht Pod-Metriken
  • Skaliert Replica-Anzahl
  • Target-basierte Skalierung

Metriken

  • CPU Utilization
  • Memory Utilization
  • Custom Metrics
  • External Metrics

Konfiguration

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-app
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70

Vertical Pod Autoscaler (VPA)

Funktionsweise

  • Passt Resource Requests an
  • Basiert auf historischen Daten
  • Kann Pods neustarten

Modi

  • Off: Nur Empfehlungen
  • Initial: Nur bei Pod-Erstellung
  • Auto: Automatische Anpassung

Use Cases

  • Richtiges Sizing finden
  • Batch Workloads
  • Memory-intensive Apps

Cluster Autoscaler

Funktionsweise

  • Skaliert Node-Anzahl
  • Reagiert auf Pending Pods
  • Entfernt unterausgelastete Nodes

Cloud-Integration

  • AWS Auto Scaling Groups
  • GCP Managed Instance Groups
  • Azure Virtual Machine Scale Sets

Konfiguration

  • Min/Max Nodes
  • Scale-Down Delay
  • Node Pool Auswahl

KEDA (Kubernetes Event-driven Autoscaling)

Funktionsweise

  • Event-basierte Skalierung
  • Skaliert bis auf 0
  • Externes Event Triggering

Scaler (Auswahl)

  • Apache Kafka
  • RabbitMQ
  • AWS SQS
  • Azure Service Bus
  • Prometheus
  • Cron

Beispiel

apiVersion: keda.sh/v1alpha1
kind: ScaledObject
spec:
  scaleTargetRef:
    name: worker
  minReplicaCount: 0
  maxReplicaCount: 100
  triggers:
  - type: kafka
    metadata:
      topic: orders
      lagThreshold: "100"

Best Practices

  1. HPA und VPA nicht kombinieren (CPU/Memory)
  2. Resource Requests definieren
  3. Pod Disruption Budgets setzen
  4. Graceful Shutdown implementieren
  5. Cooldown-Perioden beachten

Metriken-Server

  • Voraussetzung für HPA
  • Sammelt Resource-Metriken
  • Standardmäßig installiert (Managed K8s)

CFTools Software implementiert optimale Skalierungsstrategien für Kubernetes.

Tags:
Kubernetes
HPA
VPA
Auto-Scaling
KEDA
Cluster Autoscaler
C

CFTools Software

Geschäftsführer und Gründer von CFTools Software GmbH. Leidenschaftlich in der Entwicklung skalierbarer Softwarelösungen und Cloud-Native-Architekturen.

Artikel nicht verfügbar

Dieser Artikel ist für Ihren Zugangstyp nicht verfügbar.

Alle Artikel anzeigen