騰訊雲「數據丟失」事件引思考:雲服務究竟安全不安全?

近日,創業公司“前沿數控”針對騰訊雲的一篇檄文引發了行業關注。前沿數控發文稱,公司放在騰訊雲服務器上的數據全部丟失且無法恢復。

對於造成用戶數據丟失的問題,騰訊雲在隨後的回應中予以承認並進行了道歉,但讓雙方形成分歧是賠償金額。據悉,前沿數控提出了1100萬餘元的索賠,而騰訊雲提出的“賠償+補償”總金額為13萬餘元,二者相差甚遠。

不過該事件經過多日發酵後,8月8日晚間,前沿數控對外宣稱,基於儘快恢復“前沿數控”平臺業務運營的共同出發點,經過充分的溝通,“前沿數控”與騰訊雲誤會已經消除,雙方已制定出雙方認可的業務解決方案。

但解決方案的具體細節,包括此前引發爭議的賠償金額,雙方均未透露。對於騰訊雲和前沿數控來說,雙方之間達成共識,該事件也可以告一段落。

但實際上,這件事不僅僅是給當事雙方造成了影響,也為整個行業敲響了警鐘。在雲服務已經無處不在的今天,數據的重要性毋庸置疑,但其安全性究竟能否得到保證以及該如何保證,現在似乎又需要畫上一個問號。

小概率事件引發大問題

根據騰訊雲8月7日披露的信息顯示,該故障起源於因磁盤靜默錯誤導致的單副本數據錯誤,再加上數據遷移過程中的兩次不規範的操作,導致雲盤的三副本安全機制失效,並最終導致客戶數據完整性受損。

這兩次違規操作分別是運維人員為了加速完成搬遷任務,違規關閉了數據校驗;以及運維人員為了儘快降低倉庫使用率,違規對源倉庫進行了數據回收。

在正常情況下,數據搬遷流程會默認開啟數據校驗,開啟之後可以有效發現並規避源端數據異常,從而保障搬遷數據正確性。而數據搬遷完成之後,源倉庫數據應保留24小時,用於搬遷異常情況下的數據恢復。

一位熟悉該操作流程的業內人士告訴21世紀經濟報道記者,整個事件的根本原因是極小概率出現的“磁盤靜默錯誤”發生了。若磁盤靜默錯誤沒有發生,運維人員的上述操作也不會引發後面這些問題。“一般這種遷移不會出現什麼問題,要不他們也不敢這樣操作,只不過當小概率事件真的發生以後,原本的保護措施也沒了。”

磁盤靜默錯誤究竟是什麼?據21世紀經濟報道記者瞭解,通常大家遇到一些磁盤異常,比如硬件錯誤、固件BUG等都會得到報錯,但靜默錯誤的發生往往沒有任何警告,磁盤顯示一切正常,只有在進行數據完整性檢驗時才能發現。

在此次事件中,原本應該進行數據檢驗的步驟卻被運維人員關閉了,所以,人員違規操作不是引發故障的根本原因,但卻是擴大故障影響的重要因素。

損失值1000萬還是13萬?

此外,外界關注的另外一個焦點是這個事件的賠償問題。據瞭解,在數據丟失之後,前沿數控向騰訊雲提交了一份損失預估文件,內容包含前沿數控技術產品線發展及相關情況、丟失的數據、給前沿數控技術平臺帶來的影響、平臺損失價值評估等。綜合這些,前沿數控提出的索賠金額為11016000元。

騰訊雲制定的“賠償+補償”方案,總金額為136469元。其中,賠償部分為3569元,是騰訊雲依據賠償條款,按照前沿數控自去年12月份開戶至今產生的實際消耗予以的賠償。

二者提出的賠償金額相差之多,也引發了業界關於“數據值多少錢”的討論。信息安全專家陸寶華在接受21世紀經濟報道記者的採訪時指出,對於數據價值的判斷,現在業內沒有統一標準,所以也沒有可參考的依據。但是在做損失評估時,應該由第三方機構來做,而不是當事企業。

一位雲計算行業資深從業者向記者表示,賠償問題可以依據服務商與客戶之間的協議,看是按照數據的價值,還是按照數據的大小或使用的時長來計費。“但通常因為數據的價值難以衡量(不是一般等價物如黃金等可以折算成錢),所以通用的服務費用是按照時長、規模來計費的,賠償往往也會照此計算。”

其舉例說道,電力公司是按照每度電的價格向家庭收費,不會因為這度電是用來炒股還是開燈而產生不同的收費方式。

所以,按照服務協議條款,騰訊雲的賠償方案並無問題,但涉及到數據的價值,似乎又很難用雲服務費去衡量。陸寶華認為,或許在這件事之後,能夠促成行業形成一些約定。

雲服務還安全嗎?

從雲服務開始出現的時候,不斷提升其安全性就是所有服務商持續在做的事情,現在雲服務的安全性也已經達到了一定的高度。但不可否認的是,受限於技術能力,當前對數據存儲而言沒有徹底安全的方式。

一位雲計算行業專家向記者表示,凡是在使用的數據都有丟失的風險。首先基礎設施就存在侷限性,因為沒有設備能達到100%可靠;其次,人為因素風險難以避免,目前絕大部分的數據丟失其實都是人為操作造成的,比如說中病毒、誤操作等等。

對此,陸寶華告訴記者,通過技術手段其實可以規避掉一些人為風險。比如在此事件中,可以設定在沒有進行數據校驗的情況下,不允許數據搬遷。

但上述行業專家坦言,數據丟失的風險必須主動考慮,數據丟失的可能性永遠存在,數據容災能力是必須具備的。

多位雲計算行業從業者向記者表示,很多企業對於雲服務存在一定誤解,認為將數據放到雲平臺上就萬無一失了。從雲計算的本質來看,它為企業提供的是一個低成本的計算資源共享池,它能幫助企業提升效率,減少成本,但這不代表它是一個不會出問題的服務。

目前,雲服務商在提供服務時都會明確知會客戶,因為當前人類技術水平的限制,服務商能夠提供的服務的可用性、可靠性都做不到100%,大致能做到幾個9(如99.9999%)。

該行業專家表示,為了在此基礎上繼續提高數據的安全性,一般的解決方案是,同時使用該服務商不同區域的服務器,這樣出問題的概率就會更低。此外,對於重要數據,不管是個人用戶還是企業用戶,都需要定期做好備份。如果使用雲服務,快照、災備、離線備份等多種方式都可實現數據備份。

但需要明確的是,雲服務商對於風險的技術解決能力、容災能力都要遠遠高於企業個體,在雲服務商這邊可能出現的問題,企業即便在自己的機房也同樣可能會出現,而且維護及處理成本會更高。


分享到:


相關文章: