欢迎来到公海710 不要忽视您的业务连续性和灾难恢复计划
全球大流行引起了主流媒体、董事会、休息室和网络研讨会的关注;许多人忽视了另一个持续存在的问题。业务连续性和灾难恢复应该是业务的延伸,并受到我们墨西哥湾和大西洋沿岸地区的人们的季节性关注。随着热带系统活动的增加,我觉得有必要写一篇快速文章来提醒和指导那些负责保护您的业务应用程序、系统和用户的人员。
花点时间查看记录的灾难恢复和业务连续性计划。这不应该是一项令人畏惧的工作,因为在发生灾难的情况下,目标应该简洁有效,许多人都使用这些计划来支持 COVID-19 应对措施。考虑以下因素有助于指导决策者完成审核流程:

技术
- 验证基础架构和应用目录的准确性。对 COVID-19 的响应会导致动态技术决策,因此请确保新的解决方案受到保护,并在整个意外灾难场景中保持所需的安全态势。
- 衡量容量以应对由于工作负载可能从主要平台转移而导致的需求激增。灾难事件也会影响供应链,因此可能需要加速向接近阈值的平台增加容量。
- 基于云的解决方案仍在范围内。与所有提供商审查连接冗余、服务级别协议和支持合同。

人才
- 确认所有 BCDR 角色都配备了人员,因为许多部门由于当前的经济状况而不得不减少人员。
- 除了分配之外,还应该评估能力水平。谁拥有这项工作以及他们对这项任务的熟练程度如何?
- 根据人才差距分析,确定人力资源和/或托管服务机会的采购策略。

技术
- 确认用于实现有针对性的恢复点目标 (RPO) 和恢复时间目标 (RTO) 的保护平台的状态。如果组织的预算、人员配备或技术削减阻碍了成功,则协商合理的目标。
- 记录所有自动化(无人值守/有人值守)和 BCDR 的所有方面,包括站点故障转移、系统恢复、操作和测试。重点关注触发器的所有权和阈值。
- 进行桌面练习,演练灾难场景,记录问题、延误、信息差距以及任何可能影响业务的故障。这也是验证通信策略的好机会,包括任务所有权、主要/备份方法、更新频率、升级协议和返回服务通知。根据桌面体验调整BCDR方案。
虽然列出的项目看起来相当明显,但 IT 领导者的注意力可能集中在对业务运营的支持上。后续出版物将概述改进 BCDR 的机会,包括以混合多云、自动化、客户端计算、基础设施即代码 (IaC) 和容器化为中心的概念;但首先要做的事情。
如果您面临技术挑战,请随时联系欢迎来到公海710咨询。
作者