Zacznij od metryk, by potwierdzić zakres (p95/p99, endpointy, regiony), potem użyj trace do znalezienia wolnych spanów i logów do szczegółów błędów lub zapytań. Porównaj ostatnie deploye i zmiany konfiguracji.
Ustrukturyzowany proces oszczędza czas:
Checklist regresji:
1) p95/p99 rośnie? 2) Które trasy? 3) Która wersja? 4) Trace wolnych spanów
5) DB: slow query log / locki / cache hit ratio