02.28 删库跑路?安全为王,数据为王,备份为王

最近,某SaaS服务商系统故障的消息持续刷屏,官方声明称系因内部核心运维人员恶意破坏所致。

“天灾人祸”,2020年IT领域的“黑天鹅”第一大案,着实令人唏嘘。

通常情况下,对于系统常见的故障企业一般都会有相应的应急预案。经此一役,类似“删库跑路”之类的极端操作将再度引发关注:如何从技术架构、保障方法、管理体系等角度“多管齐下”,避免此类事件的发生?

删库跑路?安全为王,数据为王,备份为王

所谓“功夫再高,也怕菜刀”。人在家中坐,删库天上来。

快照、备份、CDM、CDP.......该有的手段可能都齐备,为什么故障发生后,系统仍长时间无法恢复?

还有一个问题需要思考:类似“系统所有数据库都需要重新部署”这样的极端罕见状况,你有相应的应急预案吗?

删库跑路?安全为王,数据为王,备份为王

安全为王、数据为王、备份为王。经典的“3-2-1”法则(3个备份目的地,2种备份介质,至少1份offsite copy)放之四海皆准,在不同的位置、不同的云、不同的机房多存几份数据,成本并不会高企,却能在关键时刻“保命”。

数据是核心资产,数据没了,公司可能就黄了。在备份的基础上,企业还需有数据恢复验证机制,并且常规化地开展恢复测试,确保核心数据能够得到有效保护。

当然,现实情况可能是这些工具可能都是运维做的,磁盘也都是他管的,抹干净可能只需要一行代码。什么快照、备份、CDM、CDP......统统都没用。这种情况下,唯一有用的是:考虑“哪个东西是他碰不到的”

在全面数据保护(IaaS|PaaS|SaaS)基础之上,强大稳定的灾备能力可以最大程度地保障业务连续性:

  • 一键切换,灾备运维自动化
  • 信号灯模式:日常无需启动云实例,降低云成本
  • 融合灾备和备份:云下备份,一键即时云上拉起

现在,越来越多企业选择上云,其中一个重要原因也是看重其服务能力和应急体系。当然,和核心系统本地自建的混合应用模式一样,云也万万不能是那个“唯一的终点”。企业需要清楚认识到,数据保护的责任主体仍然是自己

工具方法备好,企业仍然需要从业务韧性的角度出发,涉及内部架构、流程、管理体系、操作方法、应急机制等角度,通盘考虑,从各个维度都避免“将鸡蛋放在一个篮子里”的情况出现,才能尽可能地屏蔽各种潜在风险,减少损失。

删库跑路?安全为王,数据为王,备份为王

什么是应急预案,这里列举一个Veritas碰到用户要求补充原来的灾难预案(流程)的真实案例:

新冠肺炎疫情尚未平息,如果核心运维人员因疑似或确诊而被隔离,系统又遭遇故障,雪上加霜怎么办?

极端情况下,生产数据中心大楼可能被封锁,人员被隔离。因此,IT需要提前准备足够带宽,确保人员可以远程拨入运维以及冗余机制。同时,如果生产系统发生故障,需要考虑在无人在场的情况下进行紧急单系统切换,对每个系统有相应的应急预案。确保相关人员在远程都有最新的应急预案,确认AB角的角色,人员互为备份。

删库跑路?安全为王,数据为王,备份为王

“技术工具+方法论+最佳实践”指导下的业务连续性视角,才能真正意义上做到未雨绸缪,有备无患。

PS:听说,某大型制造业企业的核心系统的跨region云容灾项目已经有了眉目,相关工作正有条不紊进行中。


分享到:


相關文章: