打赢金融业务永续攻坚战,借助 GDPS 让业务永续更上一层楼

2020的春天注定会被载入史册 。 突如其来的疫情像一场大雪覆盖了广袤的中华大地 , 两个月来八方抗疫、九州闭户 , 给许多业务连续性准备不足的行业打了个措手不及 。
疫情所带来的的短期困扰终将逝去 , 企业在这期间更需要做的是沉着应对此过程中所展现的问题 , 并进一步思考中长期的转型和发展计划 。 在疫情这面镜子的反射之下 , 各行业都不得不认清一个事实:在任何的特殊时期 , 只有确保自身的核心系统架构的稳定 , 才能更好地保障业务的稳定性和连续性 , 从而提供始终如一的业务服务 。
这无疑给金融行业敲响了一个警钟:作为关系国计民生和影响国家经济发展的重要组成部分 , 金融行业必须要打好防疫期间的“业务永续攻坚战” 。 在这场战役的冲击中 , 如何保持嗅觉敏锐并坚挺站稳脚跟 , 维持住企业活力和服务质量 , 乃是本文所要讨论的重点话题 。
一.业务中断成本巨大 , 企业不堪其扰
其实对于金融业来说 , “维持业务永续”早已不是一个新话题 , 只是在疫情的助推之下 , 这个课题再次横亘在企业发展的路上 , 变得尤为重要 。
企业经常面临停机
根据近日一项来自ForresterConsulting的调研报告显示 , 在受访者当中至少每季度经历一次计划内或计划外停机 , 近一半的受访者每季度经历计划内停机 , 而每半个月经历一次计划外停机 。
打赢金融业务永续攻坚战,借助 GDPS 让业务永续更上一层楼
文章图片
计划内和计划外停机带来诸多挑战
IT主管在面临管理系统停机方面遇到诸多挑战 , 因为无论是计划内还是计划外 , 哪怕一秒钟的停机所引发的业务中断 , 都将会给企业的生产力和收入带来巨大的损失 。
对于计划内停机 , 将近40%的IT领导者将应用程序和系统重启时间视为首要挑战 , 而37%的IT领导者将服务恢复时间视为挑战 。 公司还努力在系统关闭时尽可能地提高效率:38%的人说 , 他们面临的挑战是找到足够长的维护窗口以适应必要的更改 。 系统停机的时间越长 , 产生的成本就越高 , 这使得应对计划内的停机的挑战变得至关重要 。
对于计划外停机 , IT领导者则试图恢复原状 , 同时尽可能减少损失 。 49%的被调查企业将数据恢复列为首要的技术挑战 , 而53%的企业将收入损失列为首要的业务挑战 。
打赢金融业务永续攻坚战,借助 GDPS 让业务永续更上一层楼
文章图片
二.IBMZ+GDPS——提高业务连续性的利器
【打赢金融业务永续攻坚战,借助 GDPS 让业务永续更上一层楼】IBMZ平台凭借总体平台的固有优势 , 提供行业领先的可用性 。 包括“并行耦合系统集群”(ParallelSysplex)的数据共享 , 和数据复制在内的诸多技术是实现这种卓越可用性的基础 。 通过部署GDPS等自动化与统筹管理解决方案 , 这种优势得到了进一步增强 。
GDPS解决方案
GDPS系列解决方案 , 旨在满足各种IBMZ的实施模式或部署拓扑的特定需求 。 GDPS解决方案充分考虑了现有数据复制技术的特性 , 包括副本的数量 , 以及运行环境所规定的与可用性相关的其他需求 。 GDPS解决方案还能够捕获并使用多个时间点的数据副本 , 确保客户的记录系统远离因网络攻击或内部恶意破坏所导致的逻辑数据损坏风险 。 根据所使用的底层复制技术 , 解决方案可分为以下几类:
1.GDPSMetro解决方案
这些解决方案是为了满足使用所谓“同城镜像”(MetroMirror)的同步复制技术的客户需求 。 GDPSMetro解决方案与“并行耦合系统集群(ParallelSysplex)”技术紧密集成 , 为z/OS*环境提供接近永续的可用性 。 GDPSMetro解决方案不仅提供数据复制管理功能 , 还为“并行耦合系统集群”提供系统管理和集群管理功能以及老道的工作流程 , 通过一系列可重复的动作 , 帮助应对可能发生的各种情况 。 该解决方案能够实现零数据丢失目标(RPO=0)以及几分钟到一小时以内的恢复时间目标(RTO) , 具体取决于部署拓扑和工作负载 。
GDPS还提供并协调HyperSwap功能 , 如果主副本发生故障 , 该功能可以透明地将主机I/O从主副本切换到从副本 。 整个切换过程只需几秒钟时间 , 通常不会影响并行耦合系统集群中正在运行的工作负载 。 这个功能也可用于z/VM系统和之上的虚机系统 , 比如LinuxonIBMZ;还可通过GDPSz/OS代理功能 , 用于GDPS并行耦合系统集群之外的z/OS系统 。
2.GDPSGlobal解决方案
顾名思义 , GDPSGlobal解决方案使用磁盘全局镜像(GlobalMirror)或z/OS全局镜像 , 两者都是异步复制技术 , 可在不受限制的距离上复制数据 。 这些解决方案为稳定运行的环境提供复制管理和监控功能;并通过强大的工作流程 , 在生产环境所在地区发生灾难时 , 对灾难恢复(DR)地区的恢复操作进行统筹协调 。 如果有明确要求 , GDPS还能够让生产系统在这两个地区之间进行轮换运营 。 如果使用异步复制 , 在发生意外情况时总是会发生某种程度的数据丢失 , 但这通常能够控制在以秒为单位的范围内 。 RTO一般为30-60分钟 , 具体取决于在灾难恢复站点重新启动系统和工作负载所花的时间 。
3.GDPSMetroGlobal解决方案
这些三站点和四站点解决方案结合了Metro和Global解决方案的各种要素 , 既能够在Metro解决方案的应用范围内确保接近永续的可用性 , 又能提供地区间灾难恢复能力 。 通过结合使用这些三站点或四站点解决方案和功能 , 客户可以做到两全其美:在生产环境所在地区 , 即使一个或多个部件发生故障 , 也能保证本地的业务连续性;而GDPSGlobal功能可以提供地区外保护 。 通过使用对称的四站点配置 , 可以灵活地在地区间切换 , 在任何地区运行生产环境都享有同等的高水平业务连续性配置 。 某些行业 , 特别是像金融行业那样特别重视且有着最严格可用性指标的行业 , 一直受到严格监管 , 他们必须证明自身能够在正常运营地点和灾难恢复地点长时间正常运转 。
4.GDPSContinuousAvailability解决方案
GDPSContinuousAvailability解决方案使用基于软件的数据复制功能 , 该功能由IBMInfoSphere*DataReplicationforz/OS提供 , 适用于Db2*、IMS*和VSAM数据类型 。 它确保客户大型机环境中最关键的工作负载能够在非常短的时间内恢复 。 具体而言 , 该解决方案在两个任意距离的不同地区中配置基于软件的复制功能(先建立网络连接) , 从而确保在两个地区中永远有一个耦合系统集群(sysplex)能够在线提供服务 。 这样 , 就不需要在这两个地区之间部署跨地区集群解决方案了 。 GDPS对构成总体解决方案的各个组件进行监控和统筹管理 , 确保当工作负载遇到故障时 , 能够以最低的延迟将工作负载切换到备用地区 。
GDPS配置示意图
打赢金融业务永续攻坚战,借助 GDPS 让业务永续更上一层楼
文章图片
自动化统筹与管理是关键
通过自动化技术 , 在发生任何情况时都不需要直接人工干预;而通过统筹管理 , 可以有效协调各种恢复操作—这两者都是实现最高水平可用性的关键所在 。 GDPS解决方案旨在确保自动化技术尽可能接近要自动化的对象 , 以便最大程度提高效率 。 GDPS还提供强大的工作流程引擎和简单的脚本语言 , 以可重复和预先确定的方式 , 统筹管理计划内或计划外事件中通常所需执行的操作 。


    推荐阅读