Havárie se stane. Otázka je, jak rychle se zotavíte.
Definice¶
- ☐ RTO (Recovery Time Objective) definováno per službu
- ☐ RPO (Recovery Point Objective) definováno
- ☐ Kritické služby identifikovány
- ☐ Závislosti zmapovány
Infrastruktura¶
- ☐ Multi-AZ/multi-region deployment
- ☐ Database replication (async/sync)
- ☐ Load balancer health checks
- ☐ DNS failover (Route53/CloudFlare)
- ☐ CDN jako fallback
Data¶
- ☐ Backup ověřen a aktuální
- ☐ Point-in-time recovery funkční
- ☐ Data replication lag monitorovaný
Proces¶
- ☐ DR runbook dokumentovaný
- ☐ Kontaktní seznam aktuální
- ☐ Komunikační plán (interní + externí)
- ☐ Eskalační postup jasný
Testování¶
- ☐ Tabletop exercise (diskuze scénářů) 1× kvartálně
- ☐ Partial failover test 1× za 6 měsíců
- ☐ Full DR test 1× ročně
- ☐ Chaos engineering (volitelné)
Realita¶
DR plán, který nebyl testován, selže v produkci. Testujte pravidelně.
drbusiness continuityinfrastruktura