Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Knowledge Base O nás Spolupráce Kariéra
Pojďme to probrat

Disaster recovery checklist

01. 01. 2024 1 min čtení intermediate

Havárie se stane. Otázka je, jak rychle se zotavíte.

Definice

  • ☐ RTO (Recovery Time Objective) definováno per službu
  • ☐ RPO (Recovery Point Objective) definováno
  • ☐ Kritické služby identifikovány
  • ☐ Závislosti zmapovány

Infrastruktura

  • ☐ Multi-AZ/multi-region deployment
  • ☐ Database replication (async/sync)
  • ☐ Load balancer health checks
  • ☐ DNS failover (Route53/CloudFlare)
  • ☐ CDN jako fallback

Data

  • ☐ Backup ověřen a aktuální
  • ☐ Point-in-time recovery funkční
  • ☐ Data replication lag monitorovaný

Proces

  • ☐ DR runbook dokumentovaný
  • ☐ Kontaktní seznam aktuální
  • ☐ Komunikační plán (interní + externí)
  • ☐ Eskalační postup jasný

Testování

  • ☐ Tabletop exercise (diskuze scénářů) 1× kvartálně
  • ☐ Partial failover test 1× za 6 měsíců
  • ☐ Full DR test 1× ročně
  • ☐ Chaos engineering (volitelné)

Realita

DR plán, který nebyl testován, selže v produkci. Testujte pravidelně.

drbusiness continuityinfrastruktura