同盾科技聯邦學習技術加持 讓數據“可用不可見”


同盾科技聯邦學習技術加持 讓數據“可用不可見”


近日,在諸多內外因素的共振下,中央重磅推動“新基建”部署,這場自上而下的大工程,將深刻影響中國未來幾十年的經濟版圖。其中,大數據生態的建設情況將是決定信息數字化的核心因素。固本方能培元,沒有安全奢談發展,沒有安全的發展就如同將大樓建立在沙子之上。數據安全與發展之間需要找到一個的平衡點,而 “可用不可見”這一具有革命性的技術理念或將是撬動這個平衡點的有力槓桿。

“可用不可見”其核心有兩層含義:數據的可用性和數據的不可見性。即在充分保護數據和隱私安全的前提下,實現大數據價值的轉化和提煉。

目前的人工智能本質上是數據智能,也就是用大數據來訓練計算模型支撐業務應用。但是現實中數據是各機構或個人的核心資產,數據孤島現象普遍存在。近兩年,我國在分別出臺了《數據安全管理辦法(徵求意見稿)》和《信息安全技術個人信息安全規範》修訂版),數據直接共享面臨更嚴峻的合法合規的考驗。如何充分利用各方的數據,讓數據對外開放,進行智能化服務,這是數據可用關心的重點。

但不可否認的是,數據可用性和不可見性,在傳統的計算模式下是很難實現的。越來越多的人認識到,數據安全建設將成為行業企業發展的根本前提,實現數據的“可用不可見”將有賴於更多的科技企業邁出創新的步伐。

數據“不可見” |全面的脫敏和去標識化

作為國內領先的智能風控與分析決策服務商,同盾科技在數據“可用不可見”領域的探索取得了很多前沿性成果。

首先是“數據的不可見”的革新。同盾將所有敏感數據進行了全面而徹底的脫敏、去標識和不可逆化,從源頭上避免了敏感的原始數據洩露風險,充分保護用戶的隱私信息和客戶機密。從而為後續智能分析和價值挖掘,提供一個陽光、可信和安全的環境。

為此,同盾寄出了一套組合拳。

1、全面的脫敏和去標識化。依照《信息安全技術 個人信息去標識化指南》和《個人金融信息保護技術規範》的要求,同盾將合規列為當前所有工作的重中之重,並動員和聯合多個部門發起了 “總攻”。

目前,階段性成果開始顯現。

第一,徹底完成了雲端API對敏感數據的去標識化。同盾提供全方位的加解密和數字簽名體系,可供數據方自主選擇針對隱私數據的加解密安全措施。

第二,徹底實現了雲端SaaS服務系統(決策引擎、指標平臺等)敏感數據去標識化,並建立起從業務規則到底層數據的自上而下的去標識化體系,業務場景中進行的決策、計算各個環節,無需依賴敏感數據原文,基於脫敏和去標識化的數據,完成業務目的。

第三,完成數據中臺的改造,實現敏感數據去標識化。當內部員工加工處理數據時,無法接觸敏感數據的明文。對數據訪問的所有場景進行嚴格的管控,根據“業務需要”和“最小權限”原則,對訪問數據的個人、應用程序實施註冊制,嚴格控制和分配訪問權限。

2、全方位的加密算法支持。同盾提供全方位的加解密和數字簽名體系,可供外部客戶、數據使用方自主選擇針對隱私數據的加解密安全措施。同盾對客戶隱私數據計算所需的加密及脫敏服務進行靈活組合,支持國密和國際標準算法,如RSA、SHA256等算法。

3、完善的DMZ區建設。對於必須用到明文的數據處理中間環節,通過調用位於DMZ區(非軍事化隔離區)的受嚴格權限管控的解密服務,通過技術手段限制只能在內存中使用明文進行計算,並且詳細記錄調用方操作日誌(數據訪問日誌、業務操作日誌、賬號管理日誌、認證登錄日誌、權限管理日誌),對操作行為進行安全審計。數據處理平臺支持LDAP、Kerberos協議,基於ACL的用戶權限管理,實現細粒度的用戶權限控制,確保數據訪問安全。

聯邦學習|打破數據孤島,讓不流通的數據也能用起來

解決數據安全和隱私保護僅是第一步,“可用性”才是大數據價值的終極體現,“可用不可見”的革命性在於能在保證不同機構間數據“不流通”的前提下,實現“信用”和“信任”的流通,實現價值的共享,從而打破不同主體間的合作藩籬。

那麼在“不可見”的前提下,是如何實現“可用”的目標呢?

同盾科技基於聯邦學習提出了“知識聯邦”的理論框架體系,支持從信息層、模型層、認知層和知識層四個層級進行聯邦,以實現數據可用不可見。

聯邦學習是一種採用分佈式的機器學習/深度學習技術,參與各方在加密的基礎上共建一個公共虛擬模型(可以相同也可以不同),訓練和交互的全過程各方的數據始終留在本地,不參與交換和合並。參與各方沒有一方能擁有所有的數據,也沒有一方擁有所有的模型,共用開放數據,而不享有數據,能最大化保護數據安全和數據隱私。

在“知識聯邦”框架中,信息層通過安全多方計算在密文空間上直接進行計算或學習,進而提取或發現知識;模型層聯邦與傳統的聯邦學習相似,基於模型加密交互共創知識,並實現知識共享;認知層對同/異構數據進行認知學習之後進行集成或多模態融合,進而生成複雜的知識網絡;知識層對分佈的知識進一步學習提煉,實現基於知識的表達推理及智能決策。簡單的講,智邦平臺的具有以下技術創新:

l 平臺和算法都是基於自研“知識聯邦”體系;

l 首次嘗試併成功使用聯邦神經網絡解決跨特徵聯邦學習問題;

l 針對實際場景中普遍存在的小樣本問題,成功實現聯邦元學習;

l 梯度、參數加密方式和壓縮方式完全自主研發,具有獨創性;

l 創新性提出參與方貢獻評價機制,評估參與方數據貢獻。

大數據安全生態完善是一個系統工程,技術創新、制度建設、法律法規的創新是缺一不可、相輔相成的,“可用不可見”也僅僅是為這個系統工程打下了第一根樁基,後續的發展仍有很多創新的空間,比如能否能推出更加可具操作性的法律法規,讓企業的邊界更加清晰;是否可以將一些脫敏、加密、不可逆的數據,都保存和放置到政府認證的雲平臺和公共平臺之上,讓每一次數據的流通和使用受到政府監管,是否需要建設一個社會性的大數據平臺等,總之,數據安全建設永遠在路上,我們需要更有想象力。


分享到:


相關文章: