02.28 IT外包觀察,從微盟數據丟失,看互聯網運維要向銀行運維學什麼?

微盟刪庫引起了運維圈的熱議,本來不想再重複之前的觀點,但結合與互聯網圈、銀行圈運維同仁們的交流,突然有一個強烈的想法:互聯網行業的運維真應該學學銀行了。


IT外包觀察,從微盟數據丟失,看互聯網運維要向銀行運維學什麼?

互聯網運維出現過無數次宕機事件,原因可歸為三類:

“手一抖”為典型的誤操作;

“應用、系統、底層微碼出錯”的軟件瓶頸Bug;

“挖斷光纖、電力中斷、太陽黑子爆發”等典型的不可抗力。

但這次微盟事件截然不同,這是第一次引起嚴重破壞的人為惡意破壞事件,互聯網公司的CEO都要倒吸一口涼氣,這事擱在哪個互聯網公司身上都扛不住。

2011年我從互聯網運維轉到銀行運維之後,一開始非常不適應,感覺完全是兩個體系,各種流程的制約導致效率很低。但後面慢慢地理解了這些規則的意義,也見證了這幾年銀行全面學習互聯網,從原來的穩態運維向雙態運維的積極轉型。

今天,銀行在積極擁抱互聯網、學習互聯網的海量運維之道,那互聯網運維要向銀行運維學什麼呢?

1、CEO 要親自抓“業務連續性”

互聯網行業對於技術常說的一句話是“開著飛機換引擎、高速公路換輪胎”,這裡面透著對於技術支撐業務高速發展的自豪,但是成功的背後是一次次的宕機,通過不斷試錯和快速恢復才慢慢支撐過來。這樣的代價在業務早期還能支撐,在互聯網成為基礎服務的今天,代價越來越無法承受。疫情之下,互聯網業務的中斷,已經不是一家公司的事情,而是成為了影響國計民生的大事件。

銀行一直特別重視業務連續性管理,把業務連續性上升到承擔社會責任的高度。大家可能不知道的是,銀行關鍵系統故障超過2小時要報銀監會,超過4小時要報國務院。在這樣的壓力下,才催生出“兩地三中心災備體系”、“高冗餘”、“應急切換”等業務連續性解決方案。互聯網公司的CEO,需要把業務連續放到和業務增長同樣的高度來看待。

2、CTO正確看待”穩定運維” 和 “敏態運維 ”的利弊

銀行是穩態運維的代表,互聯網是是敏態運維的代表。大家都知道穩態的優點是安全,代價是不敏捷,但潛意識裡面認為互聯網運維的敏態是既敏捷又穩定,敏態比穩態更加先進。

但事實上,敏態是在效率和安全上尋找平衡點,這個平衡點往往和互聯網的風險意識以及投入是相關的,大部分敏態運維沒有考慮一些極端情況。另外,互聯網運維經常宣傳的一個人運維幾十萬臺服務器,也是有一些誤導效應的。場景不一樣、安全要求不一樣的情況下,單純對比運維的人效是沒有意義的。

3、數據中心負責人不但要保安全,還要防風險

互聯網的安全部門,銀行數據中心叫風險管理,雖然安全和風險的職責類似,但是含義不同。互聯網強調的是對安全事件的快速響應和快速處置,更多情況下安全還是防範外部風險。銀行的風險管理,則是默認認為人是不可靠的,防範內部風險和外部風險同樣重要。風險管理、安全響應、內審、外審,儘量實現崗位和人員之間的相互制約。風險無處不在,業務跑得越快,面臨的風險就越大。

4、不要通過技術手段解決管理問題,承受必要的管理代價。

必須承認,微盟的事件,技術上是無法預防的,最多隻能降低損失。互聯網公司默認運維人員必須7*24小時待命,VPN是和筆記本電腦一樣的辦公標配,隨時隨地可以接入生產環境操作。

銀行則是嚴格執行開發和運維分離,生產網和辦公網分離,root權限按需申請,在特定的在ECC機房使用特殊終端才能操作,變更操作需要雙人複核,開通VPN需要申請、說明理由並指定時段等等,這一系列措施都是銀行一直以來默認的規則,導致很多銀行運維人員很難理解為什麼會發生微盟這樣的事件。代碼會有漏洞,人是不可靠的,物理上的限制和流程上的控制,雖然會降低效率,但是隻有技術和管理並重才是雙保險。

5、運維開發和運維操作的團隊必須分離,重視運維平臺的非功能需求。

互聯網早期的運維開發都是運維人員兼職,自己給自己做工具,追求的是效率和靈活,都覺得自己做的鞋最合自己的腳。但是這樣的問題是,運維人員既當運動員又當裁判員,對風險防範、性能等非功能需求缺少考慮。隨著人員和規模的擴大,潛在風險越來越高。

運維平臺的本質是管理工具,需要固化管理策略和風險防範來約束人員的行為,抵禦黑天鵝事件。設置獨立的運維開發團隊,同時面向管理員和管理者,兼顧效率和風險的需要,是互聯網公司運維平臺的發展方向,畢竟不穩的情況下快是沒有意義的。

最後,結合十五年互聯網和銀行的運維經驗,我想說:穩態和敏態,銀行運維和互聯網運維並不是對立的,而是在不斷融合。銀行從關鍵系統向海量系統演進,互聯網系統從海量系統向關鍵系統演進,最後是殊途同歸,目標、思路和方法論都同樣適用。銀行開放的學習互聯網,互聯網也應該積極學習銀行,不要過於自信。金庸先生《倚天屠龍記》中一段飛禽和獅虎的比喻說的好:

張無忌學會乾坤大挪移心法後,武學上的修為已比他們均要高上一籌。但說殷、宋二人的招數中頗有破綻,卻又不然。張無忌不知自己這麼想,只因身負九陽神功之故,他所設想的招數固能克敵制勝,卻往往實際難能,常人萬萬無法做到,也不是比殷、宋二人更妙更精。正如飛禽見地下獅虎搏鬥,不免會想:“何不高飛下撲,可操必勝?”殊不知獅虎在百獸之中雖最兇猛厲害,要高飛下撲,卻力所不能。張無忌見識未夠廣博,一時想不到其中緣故。

整理/上海藍盟蘭寧,IT外包專家。


分享到:


相關文章: