"可信數據-身份和數據共享的新框架"的摘要

我讀了《麻省理工學院連接科學與工程》一書中的"可信數據"。 這是對其革命性的可信數據Internet框架的簡要概述。

> Source: SP, 2020, "Trusted Data — A New Framework for Identity and Data Sharing" Cover

可信數據-由Thomas Hardjono,David L. Shrier和Alex Pentland編輯的一種新的身份和數據共享框架引入了一種革命性的體系結構和框架來構建可信數據Internet。 該框架的目的是在保護數據隱私的同時實現有效的實時數據和見解共享-隨著數據需求的增加和國際數據保護法規對數據使用方式的新限制,當今人們對此挑戰進行了廣泛討論。

這是核心概念的摘要,但僅在非常高的層次上涉及框架。 我承認這380頁的理論,研究和分析並不能讓您徹夜難眠,但是這個項目非常有趣。 此外,Shrier是我參加的賽義德商學院和牛津大學區塊鏈戰略計劃的主要講師。 Shrier在區塊鏈,數字ID和數據共享領域做了很多工作,這也是我熱衷於閱讀更多有關這項工作的原因。

誰應該讀?

對於那些想學習和閱讀更多有關數據共享和數字ID替代框架的人來說,這本書很有趣。 您應該至少對數據框架以及區塊鏈技術有基本的瞭解,否則本書的第一部分將討論框架的技術執行,因此可能很難理解。

手頭有什麼問題?

數據在很大程度上被稱為世界上最有價值的資源。 沒有人否認在數字時代,數據就是力量,由數據驅動的決策將改變我們所知道的生活。 但是,我們當前的數據共享生態系統存在缺陷,過時且不適合目標。 該書解決了以下問題:

網上缺乏身份證明

由於我們一直保持聯繫,因此仍然沒有安全可靠的方式在網上標識自己,就像書中描述的那樣:"在互聯網上,沒人知道你是否是狗"。 在日益數字化的世界中,我們現有的識別系統仍然是模擬的。 這使您很難核實您的身份,而且還很容易成為身份盜用的案例,並且現在經常在新聞中成為頭條新聞。

現有的基礎架構無法解決數據隱私問題

多年以來,我們現有的基礎架構旨在滿足不斷增長的數據需求,而無需考慮維護數據隱私方面的許多問題。 儘管國際上已經引入了數據保護法規來解決此問題,但如果沒有以"設計中的隱私"原則為核心的技術架構,則幾乎不可能在線獲得可靠的數據隱私。

數據主要存儲在筒倉中

每分鐘收集大量有價值的數據。 但是,該數據基本上不可訪問。 傳統上,IT系統是建立在孤島中的,並且彼此不兼容。 這非常低效,原因有兩個:

· 合併後可以解鎖數據的真實價值。 例如。 將醫療數據與位置數據結合起來,可以從根本上檢測出可能的大流行的威脅(想像我們從一開始就可以檢測到並追蹤到Corona病毒),

· 它消耗大量容量。 相同的數據在不同的數據存儲中存儲了很多次。 只需考慮一下您共享住家地址的頻率即可。 最重要的是,數據經常過時且不準確,並且沒有適當的系統或記錄來跟蹤和跟蹤所做的任何更改。

解決辦法是什麼?

該框架和體系結構稱為可信數據Internet。 它可以實現高效,準確的數據共享,同時保留數據隱私。 本質上提出一個適合並值得處理"現代社會之油"的框架。

該書深入討論了軟件體系結構的工作原理。 部署計劃,安全性,技術要求,治理以及它如何適應當今社會。 該摘要涉及OPAL框架的要點和特徵:

  • · 個人數據存儲或PDS
  • · 通過審查算法的數據洞察
  • · 同意訪問數據
  • · 數字身份證

1.個人數據存儲或PDS

框架的關鍵部分是數據存儲庫,也稱為"個人數據存儲"(PDS)。 並非將您的數據到處複製,複製,而是將所有原始數據存儲在指定的PDS中。 PDS具有一些獨特的特徵:

a)數據永遠不會離開存儲庫

乍看起來,這是違反直覺的,因為該框架的目標是允許更多和準確的數據共享-我們將做到這一點。 現在,思考的過程是您知道數據的存儲位置,只有一個副本,並且除非您想將其移動到其他地方,否則數據永遠不會離開它的位置。

b)PDS是為您提供的服務

這些存儲庫可以由現有的公司和機構(例如銀行)管理,也可以是向您提供PDS服務的新型服務提供商。 您可能有幾個帶有不同提供程序的PDS,這些提供程序存儲了數據的屬性(健康數據,財務數據等)。 想法是一樣的,存儲庫提供商代表您存儲數據,甚至他們也無權訪問。

c)數據已加密,存儲已分配

將這些寶貴的數據存儲在一個地方會對黑客攻擊構成高度威脅。 為了保護您的數據,該框架採取了多種措施。 最重要的兩個:加密和分佈式存儲。

在拆分存儲庫並將其分發到包含加密數據片段的許多不同位置時,數據將一直加密,並且始終保持加密狀態。 這是一種安全的機制,可以保護您的數據,並使惡意黑客幾乎無法訪問它。 這是如何運作的? 想象一下,所有數據都被鎖定在一個保險箱中。 黑客只需要"解鎖"一個保險箱即可訪問所有內容。 相反,想象一下您的數據被切成碎片,並分佈在未知位置的許多不同的保險箱中。 如果惡意玩家訪問一個保險箱,那麼他只會得到對他沒有價值的無法讀取的數據片段。 他需要同時破解所有這些文件並解密數據才能訪問。

只有您才具有授予第三方訪問數據權限的密鑰。

2.通過審查算法的數據見解

還記得我們說過您的原始數據永遠不會離開您的PDS嗎? 因此,問題是有人在需要時如何訪問它。 要管理的軟件架構稱為OPAL或"開放算法"。 服務提供商通常需要數據來為您提供服務,例如 人壽保險公司需要有關您的某些數據才能給您報價。 目前,他們正在收集數據(希望數據正確無誤),並在其本地系統上進行分析以得出報價。

使用OPAL,保險公司可以使用算法將洞察查詢發送到您的PDS,而不必複製數據並將其存儲在其他位置。 這些算法進入您的數據存儲,在防火牆後面運行分析,然後返回請求的結果或對數據查詢器的洞察力。 因此,存儲庫需要具有根據可用數據接收,執行和評估接收到的查詢的能力。 保險公司不需要知道您的健康史,他們只需要在某些方面瞭解是或否,就可以為您提供報價。 同樣,政府可以實時查詢數百萬人每日通勤數據的見解,以評估流量並改善基礎設施,而無需知道您是誰或無法找到您。 查詢者不是共享可識別的信息,而是接收匿名見解。

此外,每個(數據洞察)事務都有唯一的標識符,並且使用時間戳不可逆地記錄在分佈式分類帳中,從而使每個數據事務都可追溯和透明,從而為給定數據集的真實性和歷史記錄提供了唯一的真實來源。

您可能想知道這些算法的來源。 從本質上講,可以在加密數據上運行以提供洞察力的算法必須由官方機構(本領域的主題專家)針對由受信任框架的參與者決定的一組特定規則和標準進行審查。 例如。 這可能是醫療保健系統中參與者(例如醫院和醫療信息系統運營商)值得信賴的框架。 當保險公司要求提供洞察力時,該算法將針對您與任何提供者擁有的所有PDS一起運行。 可以將算法本身想象為酷兒可以選擇的已批准命令。

為此,它需要組織,企業和機構進行協作。 想法是將數據存儲在指定的位置,並且數據查詢器可以使用經過審查的算法來發出數據請求。 您可以確保您的數據是安全的,並且查詢者可以確保實時獲得經過身份驗證的見解。

3.同意訪問數據

該體系結構的另一個重要方面是,儘管存儲庫運營商將PDS作為服務提供,但他們無權決定數據的處理方式。 數據屬於數據所有者,由他決定如何處理數據。 在我們當前的數據經濟中,您的數據正在共享並出售給第三方,而您卻並不知道。 在OPAL框架中,數據所有者同意查詢者。

4.數字身份證

可信數據框架為數字身份提供了一種潛在的解決方案,該解決方案可在安全的同時進行驗證。首先,有一個人的核心身份。此核心身份類似於數字格式的身份證或護照。核心身份可由受信任的實體(例如政府)發佈。此外,該身份僅對所有者具有唯一性,並且絕不與任何人共享。所有者可以從那裡創建所謂的"角色"或筆名身份。角色是一個人的獨特屬性,您可以擁有一個人獨特的"工作"角色,"政府"角色和"健康"角色,但不會洩漏任何敏感信息。例如。當您在線申請工作時,您不得分享有關您的婚姻狀況,出生日期,宗教信仰和性別的信息。相反,您與公司共享"工作"角色。由於這些屬性與您的核心身份相關聯,因此與您的工作角色共享的任何信息都將得到驗證並且可以信任。您的文憑,工作證明等可以與該角色相關聯,公司將確保共享的信息真實,而不受性別,宗教信仰,年齡等數據影響其決策的制定,從而提供更大的平等性和防止偏見。申請例如抵押您可以共享"財務"角色,從而給經紀人有關您的財務穩定性,支出行為等的見解,但沒有有關您花錢的時間,年齡和性別(即使不應該)會影響決策的數據消極的。

為了實現這樣的系統,它需要全球範圍內的身份和訪問管理,並且必須在許多受信任的參與者之間分配權限,否則系統安全可能會受到威脅。

Trusted Data更深入地研究了該架構的管理方式,其測試和研究工作以及該架構的技術設置(主要基於區塊鏈技術)。 但是,這使您對概念有了很好的瞭解。

總結和主要好處

身份和數據共享框架是一種革命性的解決方案,可以在保留和保護隱私的同時極大地改變我們訪問和處理數據的方式。 麻省理工學院和所有相關方正在引領進入"可信數據互聯網"的道路。 這種架構的好處可以產生巨大的影響:

數據所有者處於控制之中,隱私受到保護

顯然,這並不是一成不變的,數據所有權也不總是那麼簡單,哪些數據屬於個人,哪些數據屬於公司? 儘管這是一個定義問題,但該框架允許將數據控制給擁有它的人。 此外,由於數據永遠不會離開其存儲庫,並且始終被加密,因此可以確保隱私。

大規模實時,驗證,洞察和分析

這種模式為機會開闢了一個全新的世界。 研究人員,新興技術(如AI)和政府機構可以實時獲取經過驗證的綜合見解,並確保信息來自單一事實來源。 政府,例如 通過準確地瞭解市民每天在該地區的活動和互動方式,可以在不侵犯隱私的情況下改善整體福祉。 隨著新數據洞察力的出現,將促進網絡創新,並且研究機構無需進行冗長的研究和調查即可獲得真實的洞察力。

安全透明

該框架基於區塊鏈技術原理,在很大程度上是分散的。 沒有一個實體(或功能強大的少數實體)可以控制基礎結構,而是將其分佈在提供計算資源並就地執行共識機制的許多節點之間。 它提供了針對攻擊的最高保護。 此外,它允許追溯各種數據,算法和過程的來源,支持"來源鏈"進行審計,同時保證透明度。

網絡可擴展性和互操作性

使用PDS(單一的數據真相來源和分散的架構),該框架不會遇到與我們當前系統相同的挑戰,解決了有關互操作性和可擴展性的問題。

批判

隨著我們以光速進入主要依靠數據工作和運行的數字社會,迫切需要一種新的基礎架構來支持數據並滿足目標。 現有系統是根據需要隨時間推移而構建的,而沒有在效率和安全性方面考慮過多。 惡意播放器太容易了,因為當前的體系結構從來沒有建立或設計來保護其核心數據。 因此,遷移到"可信數據互聯網"不僅令人欽佩,而且是可取的。

我批評的重點是執行力。 儘管給出了各種示例,說明了如何在所謂的"生活實驗室"(參與實時實驗以測試OPAL框架的可行性的城市和環境)中試用軟件體系結構,但是實現方面的挑戰是巨大的。 該方法非常具有戰略性,並且自上而下。 麻省理工學院與包括政府,大學和研究機構在內的合作伙伴緊密合作,並且要公平起見,要取得如此巨大的成就,您需要擁有這些聯繫。 但是,您還需要人們的集體支持。

事實是,即使實施了數據保護法規,圍繞數據洩露和身份盜用的醜聞(如果以人們的日常行為來衡量),大多數人也不是很擔心。 無論是在英國還是在歐盟,無數的研究都發現了這一矛盾。 人們在調查中聲明的關於隱私的擔憂並不能反映他們每天的實際行為。 從共享數據中獲得的便利被認為比圍繞數據隱私的問題還重要。 因此,似乎對於保護隱私的框架的需求並不是公眾的普遍關注。

如果數據所有者真的不在乎或擁有了解問題的工具,那麼大多數政府將不會投資於一個革命性的框架,該框架只有在信息生態系統的所有部分都參與其中時才能發揮作用,最重要的是,數據所有者才是中心 它的。 此外,該書多次強調,要使該框架(特別是數字ID)起作用,就需要全球協作,認可和共識。 不幸的是,圍繞集體購買的挑戰和大規模調整的需求通常是未能實施基於區塊鏈的解決方案的主要原因之一。 解決方案通常具有突破性的差異,但需要整個生態系統參與才能真正展示其優勢和價值。

Shrier確實談到了這些挑戰,還提到許多初創公司正在太空領域進行創新。 然而,就目前而言,執行計劃缺乏個人的參與。

我認為,使人們能夠通過一個單一的接觸點了解其完整的數字足跡,並允許企業和個人之間就數據使用許可進行直接交互的解決方案,將是樹立所需意識並獲得公眾支持的第一步。 實現可信數據互聯網。

(本文翻譯自Sabrina Palme的文章《A summary of "Trusted Data — A New Framework for Identity and Data Sharing"》,參考:
https://medium.com/datadriveninvestor/a-summary-of-trusted-data-a-new-framework-for-identity-and-data-sharing-94ada762b3fe)


分享到:


相關文章: