Głębiej
Najbezpieczniejsze oszczędności to usunięcie marnotrawstwa i płacenie właściwej ceny za stałe użycie — nie cięcie redundancji.
Praktyczne dźwignie
- **Right-size + autoscaling**: opieraj się o metryki (CPU, pamięć, p95 latency) i ustaw sensowne reguły skalowania.
- **Commit na steady state**: reserved instances/savings plans dla przewidywalnej bazy, autoscaling na piki.
- **Caching**: CDN dla assetów, cache aplikacyjny dla drogich odczytów.
- **Porządek w storage**: lifecycle policies (zimne dane do tańszych klas), usuwanie osieroconych wolumenów/snapshotów.
- **Mniej egress**: trzymaj ruch w regionie, kompresuj, unikaj cross-region chatter.
- **Koszty observability**: mniej verbose logów/krótsza retencja; sampling trace.
Typowe pułapki
- Wyłączenie multi-AZ/replikacji „dla oszczędności” (spada niezawodność).
- Over-logging i większe rachunki za logi niż za compute.
- Płacenie za idle zasoby (nieużywane load balancery, IP, dyski, środowiska dev 24/7).