Głębiej
Wysoka dostępność zaczyna się od zdefiniowania failure domainów i celów:
- **RTO** (jak szybko musisz wrócić)
- **RPO** (ile utraty danych jest akceptowalne)
Multi-AZ (w jednym regionie)
Typowy baseline:
- stateless instancje aplikacji na 2–3 AZ,
- load balancer z health checkami,
- zarządzana baza w trybie multi-AZ albo replikacja/failover,
- redundantne cache/kolejki.
Multi-region (między regionami)
Dla disaster recovery lub globalnego latency:
- **active-passive**: jeden region obsługuje ruch, drugi jest standby (prościej, ale czas failover).
- **active-active**: oba regiony obsługują ruch (trudniej: spójność, konflikty, split-brain).
Praktyka
- Multi-AZ domyślnie dla produkcji.
- Multi-region, gdy Twoje RTO/RPO lub wymagania regulacyjne wymagają przetrwania awarii całego regionu.
Typowe pułapki
- Ignorowanie semantyki replikacji (eventual consistency