矩陣元謝紅軍:基於MPC的隱私計算如何保障數據隱私

在10月31日,萬向區塊鏈蜂巢學院聯合矩陣元舉辦了“區塊鏈+隱私計算與數據隱私保護”的分享活動,矩陣元高級副總裁謝紅軍發表了《基於MPC的隱私計算如何保障數據隱私》的主題演講,分享了數據面臨的挑戰,帶來的問題,也介紹了MPC算法。通過隱私計算的能力釋放整個數據的價值,使其變得更有價值,帶領大家從技術及商業的角度深入瞭解數據隱私保護。以下為謝紅軍先生演講全文,有部分不影響原意的刪減:


矩陣元謝紅軍:基於MPC的隱私計算如何保障數據隱私

謝紅軍在演講


今天我的演講題目是“基於MPC的隱私計算如何保障數據隱私”,我會分享目前數據隱私的現狀,數據隱私洩露所面臨的問題,以及矩陣元目前正在做的“隱私計算”如何解決這個問題。


數據隱私保護的嚴峻挑戰

隨著互聯網的發展,數據已經成為一種重要的“戰略資源”。大數據環境下,誕生了新型的“流量經濟”,同時催生了大批依賴數據的“廣告”公司。

當前互聯網企業一個重要的盈利模式是:通過採集分析龐大的用戶數據,對用戶進行數據畫像,之後“投其所好”進行“精準”廣告投放,以此獲得不菲廣告收入。

其中,最典型的是我們所熟知的互聯網巨頭Google和Facebook,Google多年的廣告收入佔整體收入的90%以上,而Facebook廣告收入甚至佔到了整體收入的98%。據eMarketer估測,2018年,Google廣告收入較去年將增長14.5%,達到399.2億美元;Facebook廣告收入較去年將增長16.9%,達到210億美元。


數據隱私洩露帶來的問題

科技推動人類文明進步,我們應當充分挖掘並利用數據價值讓生產生活更便捷,但同時也應當看到在數據採集、使用過程中不斷湧現的新問題,如:

1、數據的過度採集和濫用

此前曝出的“大數據殺熟”事件,就是濫用數據的一種表現,部分企業不只是利用我們的數據為我們提供便利,還可能趁我們不注意“宰”我們一筆。

2、數據的管理不規範與混亂

以共享單車為例,最近兩年出現了數十家共享單車公司,每家都收集了大量用戶數據,包括手機號、所在地、騎行路線等等。而那些已經退出業務運營的共享單車公司,他們採集的海量數據現在都在哪裡?這很可能也會引起接下來要講的隱私洩露的問題。

3、數據的隱私洩露

除了大家熟知的Facebook劍橋分析醜聞事件,Facebook最新數據洩露的消息是:9月30日,黑客竊取數字登入碼,侵入了近5000萬用戶的帳號,連扎克伯格本人都未能倖免。

4、數據的流動困難

越來越多的企業、機構把數據視為其核心資產,再加上擔心數據隱私洩露帶來麻煩,不願進行數據共享和交換,形成一個個“數據孤島”。而數據只有充分利用才能發揮價值,不流動的數據只會成為被鎖死在服務器裡的無用代碼碎片。

顯然,數據隱私洩露是最需要被關注的問題。數據利用帶來的便利性,不應該成為犧牲數據隱私性的藉口。尤其是近年來各種數據隱私洩露事件的頻發,人們對數據的隱私保護愈加重視。解決數據隱私保護問題,已經成為企業乃至整個社會必須面對的挑戰。

歐盟已經率先從法律層面對數據隱私保護進行了響應,今年5月25日生效的《通用數據保護條例》(GDPR),被稱為“史上最嚴格的隱私保護”法案,其要求企業必須通過技術手段保護用戶數據隱私,保障用戶對自身數據的控制權。不少國家和地區也表現出了“跟隨”GDPR的趨勢。

站在企業的角度,不論是為了尊重用戶、遵守法律,還是為了保護自身聲譽和利益,都迫切需要找到數據利用和隱私保護之間的平衡方案。


信任與評價

數據的流動、交易,面臨著信任的難題,信任是數據高效流動、交易的基礎。整個數據的生產、服務以及全壽命週期有幾個階段。生產,包括個人、互聯網、物聯網等企業。還有存儲+計算階段,這個階段出現了雲存儲、雲計算公司。還有利用機器學習、人工智能對算法進行操作和處理。

數據越來越多,節點爆發式增長的時候,任何機構、組織、個人沒有能力獲得全域的數據。

我們提出了數據的“三權分立”的概念:第一個是所有方,所有方是數據的產生方,同時也可能是數據的需求方;使用方是需要進行計算的這一方,同時也可能是數據所有方;還有

執行方,提供可信任執行環境,具有高強度隱私保護能力。

如何才能解決這個問題?我們應改變單一依賴第三方的信任和制度性、模型化的評價方式,從技術機制上打造新的信任和評價機制,用機器的語言進行統計和評估


下一代計算架構的對策

矩陣元想打造“計算工廠”和“服務集市”,而不是簡簡單單的數據集市。我們做的一項工作是以電路為表現形式的公共基礎設施,還原計算的本源。我們的整體技術架構包含零知識證明、同態加密、安全多方計算(MPC)等大量密碼學算法,主要通過MPC來實現數據的安全共享與協同計算。MPC其實是密碼學上的概念,由姚期智院士在1982年以“百萬富翁問題”實例提出。MPC價值在於:可以保證在利用數據的同時,最大限度地保護用戶對數據的所有權,避免數據的濫用與隱私洩露。

矩陣元已經在密碼學和區塊鏈相關技術上進行了兩年多的研發投入,今年6月份已經上線了以MPC為核心的JUGO安全多方計算平臺。通過部署MPC節點,各參與方可以在本地數據不被歸集、隱私數據不被洩露的前提下,共同執行既定邏輯的運算,獲取共同想要的數據分析結果。

在MPC整個計算協議執行過程中,各參與方對自身數據始終擁有控制權,只有計算邏輯公開。計算參與方只需參與計算協議,無需依賴第三方就能完成數據計算,並且各參與方拿到計算結果後也無法推斷出原始數據。


我們的實踐

示範項目:強隱私保護數據的協同計算。

項目背景:科研期間研究機構需要採集大量的基礎數據,但因為政策壁壘,數據隱私等約束,機構持有的數據無法交互,造成數據採集工作重複,歷史數據採集難度大,進而導致行業內大量的數據資源沒有得到有效使用和深度分析。

客戶需求:在保護計算數據安全的條件下,強隱私保護數據方之間的協同計算。雙方無法看到對方的具體數據,但同時可以獲取到最終計算結果。

解決方案:在兩地機構的服務器部署JUGO-SDK,任意方使用在JUGO-IDE中編寫的計算邏輯發起計算任務,雙方在JUGO-SDK中輸入計算數據後,執行MPC計算。最終可以指定某一方,或雙方都獲得最終計算結果,MPC計算即完成。在此過程中,雙方數據都未離開本地,除了計算結果以外,無法獲取另一方的任何數據。

除此之外,矩陣元已為廣告、醫療、徵信、機器學習等行業客戶,提供了基於數據隱私保護的跨機構數據分析、多源數據模型訓練、圖像身份認證等多種服務。

歡迎大家持續關注矩陣元的官網,今年年底,我們會做全國性的大型研討會,聚集學術界、技術界、法律界以及業內專業人士,一起來探討數據隱私保護和隱私計算,歡迎大家前來參與。


分享到:


相關文章: