AI困境-數據、模型、隱私

AI困境-數據、模型、隱私

AI相關的隱私保護問題,正在逐年受到人們的重視。行業內的很多技術人員也將視線聚焦到一種新的技術——聯邦學習,以此來加強對個人和企業的數據隱私保護。

隱私的影壁

2018年5月25日,歐盟出臺《通用數據保護條例》(General Data Protection Regulation, GDPR),作為關於數據隱私保護的法案明確了對數據隱私保護的若干規定;更早之前,中國在 2017年6月1日起實施《中華人民共和國網絡安全法》,其中也指出 "網絡運營者不得洩露、篡改、毀壞其收集的個人信息;網絡運營者收集、使用個人信息,應當遵循合法、正當、必要的原則,公開收集、使用規則,明示收集、使用信息的目的、方式和範圍,並經被收集者同意;(網絡運營者)保障網絡免受干擾、破壞或者未經授權的訪問,防止網絡數據洩露或者被竊取、篡改。"這些法律條文都明確了用戶數據的收集必須公開、透明,企業和機構之間在用戶授權的情況下才能進行數據交換。

隱私的守護神

聯邦學習作為隱私的有效保護手段,這種技術很多人可以講出無數的優點與缺點,而我今天主要為大家帶來聯邦學習和數據、模型、隱私三者的關聯剖析。

首先,什麼是聯邦學習?

"聯邦學習"本質上是一種加密的分佈式機器學習技術,因為加密,所以數據不易洩露,隱私得到有效保護。實際操作上,數據將不會上傳,模型訓練在本地進行,將訓練的結果上傳,多家上傳的結果共同維護一個共有模型。

在 2018 年 12 月新一代人工智能院士高峰論壇中,楊強教授介紹過聯邦學習的兩種模式:縱向聯邦學習,不同的數據庫中有部分數據特徵是相同的,A 方和 B 方都持有模型的一部分,通過同態加密技術傳遞重要的參數;第二種模式,橫向聯邦學習,在 A 方、B 方各自更新模型並上傳,雲端服務器根據一定的策略統一更新他們的模型。

從一個個訓練系統的微觀單位來看,國內和谷歌差異不小:國內在B端層面,以組織(多人,多終端)為單位,進行數據內部的集成和訓練,這種屬於縱向;谷歌將一個個手機硬件的C端作為數據的容器和訓練端,訓練完成後,將模型的訓練成果上傳,這種屬於橫向。

聯邦中數據和模型的價值

在B端聯邦學習體系中,如何衡量每個成員對於共有模型的訓練的貢獻度,將會是推廣聯邦學習中一個重要議題。首先,作為企業加入一個聯邦學習的聯盟一定是因為利益的牽連,在同樣類型的業務(例如內容推薦系統)不同的數據量會產生不同的訓練貢獻度,但是將會作為利益的產生載體的共有模型又只有那麼幾個。搞利益均攤,顯然不符合實際的訴求。

為此,我認為應該引入供應鏈金融的資金流動方案。類似考量,有些研究者認為應該引入區塊鏈的激勵機制:按照模型效果對應獎勵,來促進聯邦的正向發展。

如果參照供應鏈金融的模型,就需將縱向聯邦學習中每個成員對於聯邦模型的的貢獻度做透明公開的可查詢化記錄。例如在某一時間段的共有模型訓練中,A成員貢獻度為40%,B成員貢獻度為35%,C成員貢獻度為25%,而此時模型的可用度已經達到了較高的可用水準,那麼可將貢獻度記錄,然後在一定的週期內,進行聯邦內部的結算(金錢或者資源置換等等)

聯邦中的大眾隱私

如果把個人和企業所產生的數據看做是原始的礦石的話,那麼訓練後產生的模型則是經過冶煉鍛造的金屬材料。這些材料可以建起高樓大廈,也可以製成神兵利器,用處之廣是作為非互聯網從業者的普羅大眾無法想象的。可以這麼說,所有的人工智能公司都在為優秀的數據模型努力。沒有了數據,也便沒有可用的模型;如此便意味著只要人工智能當中:數據——訓練學習——模型,這樣的模式存在就必然會涉及到人的隱私,大多數消費領域企業的商業隱私最終落實到數據產生主體也是個人。

對於隱私,公司和個人關注隱私洩露問題的聚焦點存在一定的差異。公司方面,更關注洩露後帶來金錢的直接或間接損失;個人方面,則不止注重金錢的損失,同時也會擔心隱私洩露所帶來的的不好的感受,也就是精神損失。

精神損失觸發的下限會很低,也就是很容易觸發精神的不悅,比如一些社交產品公司,由於功能上的缺陷導致客戶的一些自己不太滿意的自拍照流出,這當然會導致客戶心中不快。由此,可以想象未來隱私保護的任務會愈發艱鉅,畢竟"隱私"可不止自拍照那麼簡單,隱私保護的範圍和保護的數據量一直在增加

回看上面C端和B端的聯邦學習,其實在B端進行的聯邦學習,只是保證你的隱私敏感數據在聯邦的一定成員內部流動並有限開放,C端的聯邦學習才可能保證隱私敏感數據只有自己"可見"。對於消費者的不同數據的不同保護範圍,大家需求程度必然不同,總而言之精神上的損失,消費者會在不同程度上厭惡,金錢間接或直接的損失,沒有人希望發生

AI困境-數據、模型、隱私

個人的隱私多數時候像一個個位於海底的珊瑚礁,對於維護互聯網海洋的持續繁榮至關重要。用戶也希望一直讓它在海底默默的起作用,或者只是單純的被海洋吸納。但願海洋的波瀾變遷不會讓任何珊瑚礁曝光在烈日酷暑下。


分享到:


相關文章: