灾备管理平台定位于通用灾备管理场景,期望从可视化的运维试图,可控化的灾备切换流程,自动化的灾备演练场景三个方面为用户提供一体化的灾备管理解决方案,真正实现灾备管理可视、可控和易用:
可视化:
•业务灾备SLA指标监控:RPO/RTO/主备业务一致性/复制状态、链路速率
•灾备切换与演练报告
•灾备切换状态大屏展示
可控化:
•灾备预案管理
•自动化灾备切换
•灾备切换场景、流程、脚本定义、流程脚本权限控制
自动化:
• 一键式灾备演练(多应用场景)
• 灾备演练定义、演练场景、策略定义
灾备管理平台功能架构分为三个维度:设备应用层、引擎层、展现层。
设备应用层
定义为现有业务的基础架构支撑层,需要与设备应用层交互,实现灾备运维监控指标的的采集和调度命令的交互,有两种方式实现:平台自身标准的agent封装,自动化更新采集配置项;调用标准的RESTful API实现Agentless的采集。
引擎层
1、通过引擎层的自动化定义编排能力,实现切换流程的自定义,脚本资源的远程调用能力;
2、流程切换引擎:基于开源组件实现多目标场景的流程自定义,包括原有的线上线下流程,可以关联资源与人员权限;
3、统一调度引擎:提供通用的运维脚本库,实现远程的灾备运维操作,同时支持基于脚本库的自定义,提供自定义脚本编辑及验证服务;
4、系统组件:提供通用平台管理能力,包括用户认证管理和用户权限控制模块。
展现层
按照灾备运维逻辑,提供覆盖灾备管理端到端的灾备管理门户:提供灾备运维监控、灾备切换控制和自动化灾备演练能力。门户支持按照用户灾备管理重点关注内容自定义,提供标准的前端灾备服务能力。