Metryki to liczby w czasie (CPU, latency), logi to pojedyncze zdarzenia/wiadomości, a trace śledzi jedno żądanie przez serwisy (span). Razem pomagają wykrywać i diagnozować incydenty.
Odpowiedź zaawansowana
Głębiej
Sygnały observability odpowiadają na różne pytania:
**Metryki**: „Czy system jest zdrowy?” Zagregowane liczby w czasie (RPS, p95 latency, error rate). Świetne do dashboardów, SLO i alertów.
**Logi**: „Co się wydarzyło?” Pojedyncze zdarzenia z kontekstem (userId, orderId). Dobre do debugowania i audytu.
**Trace**: „Gdzie zniknął czas?” Rozproszony obraz jednego requesta przez serwisy, podzielony na spany (DB call, HTTP call, cache).
Jak to łączyć
Typowy workflow: 1) Alert z metryk (skok error rate). 2) Przechodzisz do trace, żeby znaleźć wolny/padający etap. 3) Czytasz logi dla konkretnego trace/requesta, żeby zobaczyć dokładny błąd i kontekst.
Praktyczne wskazówki
Dodaj correlation id / trace id do logów.
Uważaj na labelki o wysokiej kardynalności w metrykach (koszt + wydajność).