Autoscaling dopasowuje liczbę instancji do obciążenia (metryki typu CPU, latency, kolejka). Typowa pułapka to thrashing: zbyt agresywne skalowanie góra/dół przez szum w metrykach — pomagają cooldowny i dobre progi.