02.28 刪庫跑路?安全為王,數據為王,備份為王

最近,某SaaS服務商系統故障的消息持續刷屏,官方聲明稱系因內部核心運維人員惡意破壞所致。

“天災人禍”,2020年IT領域的“黑天鵝”第一大案,著實令人唏噓。

通常情況下,對於系統常見的故障企業一般都會有相應的應急預案。經此一役,類似“刪庫跑路”之類的極端操作將再度引發關注:如何從技術架構、保障方法、管理體系等角度“多管齊下”,避免此類事件的發生?

刪庫跑路?安全為王,數據為王,備份為王

所謂“功夫再高,也怕菜刀”。人在家中坐,刪庫天上來。

快照、備份、CDM、CDP.......該有的手段可能都齊備,為什麼故障發生後,系統仍長時間無法恢復?

還有一個問題需要思考:類似“系統所有數據庫都需要重新部署”這樣的極端罕見狀況,你有相應的應急預案嗎?

刪庫跑路?安全為王,數據為王,備份為王

安全為王、數據為王、備份為王。經典的“3-2-1”法則(3個備份目的地,2種備份介質,至少1份offsite copy)放之四海皆準,在不同的位置、不同的雲、不同的機房多存幾份數據,成本並不會高企,卻能在關鍵時刻“保命”。

數據是核心資產,數據沒了,公司可能就黃了。在備份的基礎上,企業還需有數據恢復驗證機制,並且常規化地開展恢復測試,確保核心數據能夠得到有效保護。

當然,現實情況可能是這些工具可能都是運維做的,磁盤也都是他管的,抹乾淨可能只需要一行代碼。什麼快照、備份、CDM、CDP......統統都沒用。這種情況下,唯一有用的是:考慮“哪個東西是他碰不到的”

在全面數據保護(IaaS|PaaS|SaaS)基礎之上,強大穩定的災備能力可以最大程度地保障業務連續性:

  • 一鍵切換,災備運維自動化
  • 信號燈模式:日常無需啟動雲實例,降低雲成本
  • 融合災備和備份:雲下備份,一鍵即時雲上拉起

現在,越來越多企業選擇上雲,其中一個重要原因也是看重其服務能力和應急體系。當然,和核心繫統本地自建的混合應用模式一樣,雲也萬萬不能是那個“唯一的終點”。企業需要清楚認識到,數據保護的責任主體仍然是自己

工具方法備好,企業仍然需要從業務韌性的角度出發,涉及內部架構、流程、管理體系、操作方法、應急機制等角度,通盤考慮,從各個維度都避免“將雞蛋放在一個籃子裡”的情況出現,才能儘可能地屏蔽各種潛在風險,減少損失。

刪庫跑路?安全為王,數據為王,備份為王

什麼是應急預案,這裡列舉一個Veritas碰到用戶要求補充原來的災難預案(流程)的真實案例:

新冠肺炎疫情尚未平息,如果核心運維人員因疑似或確診而被隔離,系統又遭遇故障,雪上加霜怎麼辦?

極端情況下,生產數據中心大樓可能被封鎖,人員被隔離。因此,IT需要提前準備足夠帶寬,確保人員可以遠程撥入運維以及冗餘機制。同時,如果生產系統發生故障,需要考慮在無人在場的情況下進行緊急單系統切換,對每個系統有相應的應急預案。確保相關人員在遠程都有最新的應急預案,確認AB角的角色,人員互為備份。

刪庫跑路?安全為王,數據為王,備份為王

“技術工具+方法論+最佳實踐”指導下的業務連續性視角,才能真正意義上做到未雨綢繆,有備無患。

PS:聽說,某大型製造業企業的核心繫統的跨region雲容災項目已經有了眉目,相關工作正有條不紊進行中。


分享到:


相關文章: