5.2 实现业务连续性的一般步骤
虽然我们在制定业务连续性计划(BCP)时不必遵循特定的模式,但一些最佳实践在长期的应用过程中已得到很多人的认可,尤其是ISO22301业务连续性管理体系标准的颁布,CSO在建立业务连续性计划过程中可以参考实施。一般BCP建立过程共分为如下6个阶段。
(1)发布业务连续性程序
在制定业务连续性计划前,组织需要发布业务连续性程序,来表明已经获得管理层的支持与投入。为了确保BCP成功,高级管理层必须参与其中,BCP必须成为公司的战略性业务计划之一。同时,组织必须设定合理资金,并为BCP提供独立的预算;必须建立一个团队,人员包括财务部、审计部、信息技术部、人事部、行政部等部门的员工。当灾难发生时,这些部门在继续扮演他们承担的支援角色的同时,也必须实施重大的机构转变以援助受影响的区域。法律部、公关部与投资部在事件发生后需要向公众及股东通告公司的运作状况。
(2)业务影响分析
决定BCP需求的关键驱动力是“企业能在灾难中承受多少金额的损失”。业务影响分析的目的是回答以下问题:优先保护企业的哪些东西可以在灾难发生后恢复最低效率的生产?这些东西目前面临何种风险?恢复它们需要多少资源?
当进行业务影响分析时,应考虑以下几方面内容:
- 金额的影响:如果不采取相应的措施,则组织的经济损失是多少?
- 客户的影响:如果发生业务中断,则组织会损失多少市场占有率?
- 法律的影响:组织是否遵从法律的要求?
- 内部依赖关系的影响:中断的业务是否会影响其他领域的关键业务?
作为业务影响分析的一部分,应该评估业务允许中断的时间长短、组织能提供多长时间的信息,以及当信息重新可用时,允许损失的信息是多少?这些问题可以通过RTO(recovery time objective,恢复时间目标)和RPO(recovery point objective,恢复点目标)来决定。决定BCP需求的另一个因素是“灾难实际发生的可能性”,此因素由威胁的级别和组织具有的薄弱点范围决定。
(3)策略及实施
业务影响分析的结果为制定业务连续性策略提供必要的信息,根据提供的信息可以确定多种满足组织业务连续管理的方案。对各种业务连续方案进行成本、效益及风险分析,包括:满足业务连续目标的能力;影响的可能性;安装设备的成本、维护、测试及调用设备的成本;中断对于技术、组织、文化和管理的干扰及未采取连续性管理的潜在影响;仔细考虑采取业务持续方案确实解决了哪些具体的风险,且不会增加其他风险。要通过风险降低和业务连续性方案成本的平衡来决定业务连续性策略,以降低风险达到业务连续的目标。实施、设立组织及准备业务连续性实施计划书,然后落实备份安排,并执行降低风险的措施。
(4)BCP开发
开发业务连续性计划之前应确定在灾难发生的情况下执行的行动,因此首先要熟悉每天的操作任务。这意味着需要熟悉每一个业务处理过程的基本文档。在开发业务连续性计划之前,须考虑下列措施是否已经存在:
- 变更控制流程。
- 最终用户的标准操作流程。
- 操作人员的具体需求和特殊外围设备需求。
- 数据流图表及问题管理程序。
- 重要记录。
- 磁带备份/记录管理日常安排。
- 异地存储。
确认后须考虑在计划执行的各个阶段中如何为每个恢复小组分派任务,如评估与声明、通告、应急反应、过渡期处理、抢救、重新安置及启动、重新正常运行等。
(5)培训计划
员工需要的一些特殊培训如下:紧急情况时可应用替代的技术和流程培训;当自动操作系统正在恢复时可替代的人工操作流程培训;确保团队成员达到推动BCP所需能力的技术培训等。
(6)演练及维护
进行演练及有规律的测试可增强BCP信心及效率,确保相关的文档时常更新。
1)BCP的演练。制定好的BCP需要进行适当演练才能投入使用,这一过程必须周期性进行。省略了这一过程就意味着BCP只能等灾难实际发生之后再进行实地检验,这样做的风险太大,恐怕任何一家企业都不敢做这种尝试。
规划一次BCP演练需要规定以下事项:演练脚本,即将可能发生的灾难定义为演练的一个部分;演练计划,即定义检查程序、各种测试脚本、任务的类型、任务的参与者,比如主要团队或者主要团队与预备团队的混合行动。
简而言之,在测试BCP时需要执行下列行动:准备一份测试计划,选择演练脚本,说明预期要达到的结果;执行该计划,记录演练结果,评估演练结果,报告存在差距,将演练结果和报告向团队公布,确认需要做何改进以弥补差距,进一步培训团队等。
2)BCP的维护。一个BCP必须周期性地加以检查和维护。一旦有新的系统、新的业务流程或者新的业务加入企业的生产环境或者信息系统,引起企业整体系统发生变化时,就更应该强制启动这种检查程序。除此之外,像联系人名单更改这样微小的变动都可能触发BCP的更新。
每一次进行这种检查时,最好与对BCP的改进相结合。例如,在演练过程中发现的问题、企业为了实现连续性对机构所做的调整,或者在保持业务连续性测试时发现了更好的行动方式和计划等。因此,BCP的维护应该是变化和改进的结合与不断促进。
每一次对BCP所做的改动都应该及时通知所有的BCP团队,并具体落实到每一次的培训和测试过程中。
最后,与业务连续性相关的资源、人和设备也会受到维护的影响,如设备会因维护程序受到影响。只有当这些资源始终处于良好状态时,才能在灾难发生时成为可靠和可依赖的资源。