Chmuramedium

Metryki vs logi vs trace — czym się różnią?

Tagi

#observability#metrics#logs#tracing

Odpowiedź

Metryki to liczby w czasie (CPU, latency), logi to pojedyncze zdarzenia/wiadomości, a trace śledzi jedno żądanie przez serwisy (span). Razem pomagają wykrywać i diagnozować incydenty.

Odpowiedź zaawansowana

Głębiej

Sygnały observability odpowiadają na różne pytania:

**Metryki**: „Czy system jest zdrowy?” Zagregowane liczby w czasie (RPS, p95 latency, error rate). Świetne do dashboardów, SLO i alertów.
**Logi**: „Co się wydarzyło?” Pojedyncze zdarzenia z kontekstem (userId, orderId). Dobre do debugowania i audytu.
**Trace**: „Gdzie zniknął czas?” Rozproszony obraz jednego requesta przez serwisy, podzielony na spany (DB call, HTTP call, cache).

Jak to łączyć

Typowy workflow: 1) Alert z metryk (skok error rate). 2) Przechodzisz do trace, żeby znaleźć wolny/padający etap. 3) Czytasz logi dla konkretnego trace/requesta, żeby zobaczyć dokładny błąd i kontekst.

Praktyczne wskazówki

Dodaj correlation id / trace id do logów.
Uważaj na labelki o wysokiej kardynalności w metrykach (koszt + wydajność).
Przy dużym ruchu stosuj sampling trace.

Typowe pułapki

Powiązane pytania

Chmura

Observability: czym różnią się metryki, logi i trace’y?

#cloud#observability#metrics

Chmura

Co to jest service mesh i kiedy ma sens?

#service-mesh#mtls#sidecar

Chmura

Co to jest autoscaling i jaka jest typowa pułapka?

#autoscaling#metrics