大數據時代,區塊鏈如何將“數據隱私安全”變為商機?

摘要: 區塊鏈在隱私計算行業的應用已經相對成熟。萬象區塊鏈的PlatON在其矩陣元體系中佔據了重要地位,公信寶也在近期發佈了其《可信計算協議白皮書》,表示會平衡“數據隱私權”和“數據商業效率”之間的關係。

大数据时代,区块链如何将“数据隐私安全”变为商机?

鏈得得注:【大文觀鏈】,是鏈得得App推出的區塊鏈技術分析系列欄目。由鏈得得App獨家作者馬文佩,對區塊鏈、數字貨幣市場中前端技術方案進行應用層講解與熱點事件的技術層分析。每個工作日與大家一同分享“鏈圈技術宅”的那些頭腦日常。

大數據=沒隱私

隨著移動互聯網、雲計算和大數據技術的廣泛應用,移動互聯網、雲計算和大數據等技術的快速發展,孕育併產生了各種新的服務模式和應用,例如打車、外賣等基於位置的服務。這些服務和應用一方面採集用戶的相關信息,另一方面為用戶提供精準化、個性化的服務,給人們的生活帶來了極大便利。然而,所採集信息中往往含有大量包括病史、收入、身份、興趣及位置等在內的敏感信息,對這些信息的共享、收集、發佈、分析與利用等操作會直接或間接地洩露用戶隱私,給用戶帶來極大的威脅和困擾。因此,用戶隱私保護已成為人們廣泛關注的焦點。

在今年的3·15晚會上,央視曝光了多個外呼公司利用機器人撥打外呼電話,而數據來源則是所謂“探針盒子”。 “探針盒子”可在用戶手機無線局域網處於打開狀態時,竊取用戶手機號碼及個人信息,再通過匹配標籤,就可以精確的獲得每個路人的個人信息並用於廣告營銷。

在這種背景下,世界各國監管機構都對數據利用和隱私保護進行了立法。最典型的是去年5月《通用數據保護條例》(即GDPR)在歐盟範圍內正式執行。該條例規定,企業處理個人數據的業務流程必須在設計和默認情況下構建數據保護,這意味著個人數據必須使用假名(pseudonmisation)或完全匿名(data anonymisation)進行存儲,並且默認使用盡可能最高的隱私設置,以避免公開數據未經明確同意被使用。對違規企業的處罰最高可達其收入的4%。

今年一月,法國數據保護機構CNIL宣佈,對谷歌處以5000萬歐元(約合5700萬美元)的罰款,原因是它沒有向用戶正確披露如何通過其搜索引擎、谷歌地圖和YouTube等服務收集數據,以展示個性化廣告。

一方面,大數據技術及其帶來的衍生服務正在互聯網行業佔據越來越重要的地位,根據IDC發佈的數據,截止到2018年底,中國大數據解決方案市場軟硬服總額達到388.8億元人民幣,並有望在2023年超過800億元人民幣,全球市場則將超過3000億美元。而另一方面,由於日益增多的數據洩露事件,世界各國對於隱私保護的監管也越來越嚴厲。英國歐華律師事務所( DLA Piper Global Law Firm )一月發佈的一份報告顯示,自2018年5月25日《通用數據保護條例》(GDPR)實施至2019年1月28日(數據保護日),共有41,502起數據洩露被通報。但該數據僅統計了28個歐盟成員國中的21個,且未包含挪威、冰島和列支敦士登等雖不是歐盟成員國卻歸屬歐洲經濟區(EEA)的GDPR轄區。在這段時間內,監管機構對GDPR違規行為的處罰就有91起。

隱私計算的概念

在這種背景下,兼顧隱私保護和數據利用的計算方式就成為了企業和學界研究的重點,2016年,中國科學院信息工程研究所副總工程師李鳳華提出了隱私計算的概念。他認為,隱私計算是面向隱私信息全生命週期保護的計算理論和方法,是隱私信息的所有權、管理權和使用權分離時隱私度量、隱私洩漏代價、隱私保護與隱私分析複雜性的可計算模型與公理化系統。隱私計算涵蓋了信息蒐集者、發佈者和使用者在信息產生、感知、發佈、傳播、存儲、處理、使用、銷燬等全生命週期過程的所有計算操作,幷包含支持海量用戶、高併發、高效能隱私保護的系統設計理論與架構。

簡單來說,隱私計算是從數據的產生、收集、保存、分析、利用、銷燬等環節中對隱私進行保護的方法。從另一個角度來說,隱私計算是一門“合規化”的生意:各國對於隱私數據的監管越嚴厲,隱私計算行業的發展前景就越大。正因為這個原因,在以GDPR為代表的一匹嚴厲的數據隱私保護規定出臺後,從事隱私計算行業的企業就越來越多,其中也不乏區塊鏈企業涉足其中。

區塊鏈如何改變隱私計算

區塊鏈技術由於其技術上先天適用於解決信任問題,所以也被隱私計算行業所青睞,公信寶、萬象區塊鏈等都是國內具有代表性的、利用區塊鏈技術解決隱私問題的企業。

其中,公信寶採用的是基於TEE(可信硬件)的可信計算協議(Trusted Computing Protocol,簡稱 TCP)。可信執行環境(TEE) 是Global Platform(GP)提出的概念。是移動設備主處理器上的一個安全區域,其可以保證加載到該環境內部的代碼和數據的安全性、機密性以及完整性。TEE提供一個隔離的執行環境,提供的安全特徵包含:隔離執行、可信應用的完整性、可信數據的機密性、安全存儲等。該技術的核心是企業和個人可以把數據處理模型部署在區塊鏈上,在鏈下Intel SGX可信執行環境中處理隱私數據,最終把可驗證結果存儲到鏈上並更新狀態。

萬象區塊鏈(PlatOn)採用的是基於MPC(安全多方計算,Secure Multi-Party Computation)的方式。MPC是一種在無可信第三方的情況下,安全地計算一個約定函數的方式,也是電子選舉、門限簽名以及電子拍賣等諸多應用得以實施的密碼學基礎。矩陣元的核心是通過部署MPC節點,各參與方可以在本地數據不被歸集、隱私數據不被洩露的前提下,共同執行既定邏輯的運算,獲取共同想要的數據分析結果。計算參與方只需參與計算協議,無需依賴第三方就能完成數據計算,並且各參與方拿到計算結果後也無法推斷出原始數據。

隱私計算雖然是近幾年隨著大數據技術的告訴發展而出現的新概念,但其核心理念卻是隨著互聯網誕生就出現的:可信計算(Trusted Computing)由TCPA(可信賴運算平臺聯盟,Trusted Computing Platform Alliance)提出,這個術語來源於可信系統,並且有其特定含義:如果一個實體的行為總是按照預期的方式和目標進行,那它就是可信的。從技術角度來講,“可信的”(Trusted)未必意味著對用戶而言是“值得信賴的”(Trustworthy)。確切而言,它意味著可以充分相信其行為會更全面地遵循設計,而執行設計者和軟件編寫者所禁止的行為的概率很低。其主要思路是在計算機硬件平臺上引入安全芯片架構,通過提供的安全特性來提高終端系統的安全性。

可信計算一度被批評為“垃圾技術”,反對者們認為可信計算背後的那些公司並不那麼值得信任,這項技術給系統和軟件設計者過多的權利和控制。換句話來說,他們認為這種技術“太中心化”了。這也是區塊鏈技術天生適合隱私計算的主要原因。

雖然區塊鏈能夠解決信任的問題,但其他問題依然存在:

首先,區塊鏈的公開透明和全節點驗證,數據將流經區塊鏈上的每個全節點,使其無法很好的處理隱私數據:公有鏈隱私保護一直是一個區塊鏈行業頭痛的問題。

針對這個問題,業內已經有同態加密、零知識證明等較為成熟的技術來實現鏈上數據的隱私保護了。其中,公信寶主要採用的是零知識證明(zero-knowledge proofs,簡寫為ZKPs),指的是證明者能夠在不向驗證者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的協議。在區塊鏈中,節點之間利用零知識證明的方式就可以在不向驗證者提供任何有用信息的情況下,使驗證者相信這個區塊是合法的。

萬象區塊鏈(PlatOn)主要採用的是同態加密。同態加密是一種加密形式,它允許人們對密文進行特定形式的代數運算得到仍然是加密的結果,將其解密所得到的結果與對明文進行同樣的運算結果一樣。換言之,這項技術令人們可以在加密的數據中進行諸如檢索、比較等操作,得出正確的結果,而在整個處理過程中無需對數據進行解密。

其次,大數據巨規模、多樣化、高增速等特徵以及大數據應用的迅猛發展對隱私保護服務請求的用戶容量、併發程度和能效優化提出了極高的要求。在這個過程當中,明文大數據分析會導致隱私洩露,而將數據加密之後,大規模數據密態化又會極大的影響分析效率。

這個問題實際上並不止出現在區塊鏈隱私計算過程當中,這是一個大數據行業普遍存在的問題:

對於公信寶這樣採取TEE方案的項目而言,由於所有計算過程都在鏈下的可信任環境中,所以不存在密態數據的計算效率問題:加密數據進入可信硬件中進行解密、計算、加密,最終得到加密數據,形成一個黑箱,在保證安全的同時保證了效率。

對於採用MPC技術的項目來說,MPC至今已經發展了30餘年,目前效率在迅速提升,約比明文計算慢兩個數量級,目前已支持中大規模商用。另一方面,以萬象區塊鏈為例,其主要研發方向是VC(可驗證計算)。計算任務都在鏈下進行,通過VC在在鏈上生成簡短的可驗證證明,讓每個任務只需要執行一次,其他節點無需重複計算就可以快速驗證,以此減少驗證上的算力浪費,提升系統的整體性能和效率。

綜上所述,區塊鏈在隱私計算行業的應用已經相對成熟。萬象區塊鏈的PlatON在其矩陣元體系中佔據了重要地位,公信寶也在4月10日發佈了其《可信計算協議白皮書》,表示平臺會平衡“數據隱私權”和“數據商業效率”之間的關係,公信寶創始人兼CEO黃敏強也向鏈得得表示,其可信計算協議將結合公信寶、布洛克城、數據交易所等應用構建全新的數據價值平臺。

隨著5G等全新技術的出現和應用,大數據行業的發展又將進入一個全新的階段。伴隨著大數據行業發展的隱私計算在未來也必然會擁有更大的發展前景。


分享到:


相關文章: