數據“可用不可見”?

◎ 科技日報記者 操秀英

對於清華大學交叉信息研究院長聘副教授徐葳來說,成為華控清交信息科技(北京)有限公司(“華控清交”)首席科學家,是“誤打誤撞”。

從單純想解決科研過程中的數據獲取問題,發一篇不錯的論文,到成立華控清交,基於圖靈獎獲得者姚期智教授40年前的理論成果,自主開發一系列基於多方安全計算的隱私計算技術,實現數據“可用不可見”,為我國人工智能和大數據產業發展提供保障,這是一個“從0到1”的原創成果轉化為技術、產業的案例,這也是以清華控股為代表的高校企業探索科技成果轉化新路徑的故事。

即便是發論文也要發“有用”的論文

這個故事要從徐葳加入清華大學交叉信息研究院說起。

作為一個標準“學霸”,徐葳本科時從清華大學到賓夕法尼亞大學,從加州大學伯克利計算機科學博士畢業後加入谷歌公司。“做了幾年的工程師,但我的理想還是做學術,所以接到姚老師的邀請,我毫不猶豫地回到了清華。”徐葳說,他開始做大數據方面的研究。

聚集不同學科、不同背景的人才,正是姚期智成立交叉信息研究院的初衷。

“做研究過程中我發現最大的難題是我拿不到數據。”徐葳回憶,“經常也有人打電話到我們實驗室,說想委託我們去做個什麼事情,但說到最後的結果基本都是讓我去他們公司使用數據,而不願意把數據拷給我們。”

徐葳說他完全理解這種做法。近年來隨著大數據技術的發展和應用,有關數據洩露的風險和討論也層出不窮。他印象比較深的是,幾年前,一家名叫Cambridge Analytica劍橋分析的數據分析公司,通過臉書平臺開發的性格小測試程序,獲取了5000+萬的用戶數據,也給臉書造成了巨大的損失。

徐葳開始想嘗試解決這一問題。“最開始的想法僅僅是能儘快發一篇論文。”徐葳坦言,“但我們學院和姚老師的要求是,需要發表有影響力的論文,所以我們開始朝著把姚老師四十年前的理論成果變成可用的方向努力。”

姚期智於1982年通過提出和解答著名的百萬富翁問題,並隨後用數學理論證明了凡是可以在數據明文上進行的計算,理論上都可以在密文上直接進行計算,並得出與明文計算完全一致的結果,從而創立了“多方安全計算”(Secure Multi-Party Computation,簡稱MPC)的理論框架。在密碼學領域,這個問題可以描述成,“一組互不信任的參與方之間在保護隱私信息以及沒有可信第三方的前提下的協同計算問題”。

數據“可用不可見”?

“當然,天下沒有‘免費的午餐’,對於相同的計算過程密文計算要比明文計算付出幾個數量級的算力,這使得多方安全計算在三十多年前僅有理論上的可行性。”徐葳說,三十多年前對數據使用的需求並沒有那麼迫切,而且也很少有人會去琢磨這個理論怎麼應用。“這就是在清華、在高校做研究的好處,只有一個方向,不知道能不能成功,你也可以放心大膽去探索。”徐葳感嘆。

科學家意識到自己不適合做企業家,就是個進步

“這一探索,就一頭扎進去了。”徐葳說。用兩三年時間,徐葳帶領他的學生們,通過工程實現,將多方安全計算的效率大大提升。

“這個時候已經能用了,更重要的是,我們知道這個技術方向走得通,並且知道怎麼繼續優化。” 徐葳說,他清楚意識到,接下來工程化的過程需要大量人力物力財力,且並非高校老師們舉一己之力所能完成。“而且,我肯定不是個能成為企業家的人。”

此時,徐葳並沒有成立企業,進行產業化的清晰想法。“我們當時想的最多的還只是這個研究能解決科研人員的數據使用問題。”

直到他與前高盛全球合夥人張旭東的一次談話。“我和張總有一次聊天,我向他介紹了我們正在做的一些課題,其他的他都沒說啥,但認為密文計算這個事情可以做大。”徐葳回憶,“都說數據是重要的資產,但它的價值如何體現?張總敏銳意識到,我們的技術可以解決這一問題。”

早在2017年,習近平總書記強調,“互聯網經濟時代,數據是新的生產要素,是基礎性資源和戰略性資源,也是重要生產力”“要構建以數據為關鍵要素的數字經濟”。

2020年3月30日,中共中央和國務院發佈的《關於構建更加完善的要素市場化配置體制機制的意見》,明確把數據列為生產要素,並提出了加快培育數據要素市場的三點要求:推進政府數據開放共享、提升社會數據資源價值、加強數據資源整合和安全保護。

2020年5月11日,《中共中央、國務院關於新時代加快完善社會主義市場經濟體制的意見》中明確提出:“加快培育發展數據要素市場,建立數據資源清單管理機制,完善數據權屬界定、開放共享、交易流通等標準和措施,發揮社會數據資源價值。推進數字政府建設,加強數據有序共享,依法保護個人信息。”

雙方一拍即合。在清華控股有限公司的支持下,華控清交於2018年6月成立。張旭東任CEO,徐葳成為首席科學家。

徐葳最大的感觸是,科技成果轉化,一定要讓合適的人去做專業的事情。“現在越來越多科學家意識到自己不適合做企業家,這就是個很大的進步。我在做這件事情中也逐步明白,很多工程上的細節也不應該是我要去管的,通過設立成果轉化的公司,我們可以引進更加專業的團隊來完善這些細節。這樣我的精力就可以一直放在解決基礎的、前沿的問題上。”

產品已在金融和政務領域有多個案例應用

“目前我們已經讓密文計算的效率和規模接近於明文大數據系統,我們原本計劃將速度進一步提升、系統更優化之後再推向市場,但很多用戶得知我們的成果後主動找上門來,希望產品儘快上市,目前我們的產品已經有多家金融和政府部門用戶,未來產品一定會隨著技術的進一步優化和創新,持續迭代更新。”

簡單來講,華控清交的產品打消了數據擁有方有關數據洩露和“用一次就失去價值”的顧慮,真正實現數據“可用不可見”,讓數據流通起來,變成資產。比如,A機構想要某些用戶群體的數據畫像,但僅憑該群體在本機構的記錄,得出的畫像比較粗略,如果加上B機構、C機構的數據,畫像就更為精準。“以前別的機構不願意分享這些數據,華控清交的產品可以實現,在不把數據洩露給任何人的情況下,讓程序在B、C的密文數據上‘跑’一圈,讓A、B、C的數據結合起來得到這個群體的畫像。既得到精準畫像,又保護了隱私。”徐葳形象地介紹。

華控清交研發的多方安全計算技術和產品是原創性的、具有自主知識產權的、計算機和數據科學的底層技術和基礎性產品,將直接解決數據互聯、融合、共享和流通中的數據歸屬和數據隱私保護問題,從而可以有效地形成社會化的數據大閉環,真正地實現把數據轉化成社會化生產要素,為國家的數據要素治理、數據生態建設、數據流通市場的建設發展鋪設道路,為國家大數據和人工智能戰略插上翅膀;同時將強有力地賦能和推動全中國乃至國際數據共享生態的發展。

正因此,華控清交也得到資本方的青睞。“目前我們已完成兩輪融資,其中,港交所為了投資我們,專門在內地成立了一家全資子公司。”徐葳說。

“但科技成果產業化的過程千頭萬緒,並不是一件容易的事。術業有專攻,清華控股多年來在科技成果轉化領域有許多成功案例,也有一支專業的團隊。他們主動對接學校院系,和老師們一起設計商業模式,尋找合適的職業經理人,幫助對接資本等各類資源,共同推進科技成果落地,彼此間很信任,溝通也順暢。”在徐葳這樣的清華老師看來,清華控股更像是科研人員成果轉化的“專業經紀人”。

據悉,華控清交是清華控股探索推進清華科技成果轉化新模式的一個典型案例。清華控股作為清華大學服務社會的重要平臺,一直致力於推動清華大學科技成果轉化和產業化,助力社會創新發展,已累計轉化56項國家級重大科技成果,實現60多項重大技術突破,推動實施3項國家科技重大專項的項目轉化,取得了一批具有國際影響力的標誌性成就。


編輯:張琦琪

審核:管晶晶


分享到:


相關文章: