金色相對論——AI+區塊鏈 究竟是風口還是噱頭?(上)

。有人認為兩種技術可以強強聯手,碰撞出巨大的火花;也有人對此產生懷疑,認為兩者的融合不是“風口”,只是噱頭。

鑑於話題的專業性,金色財經特邀人工智能領域專家、AI方向區塊鏈項目方負責人做客第七期“金色相對論”。各位嘉賓以“AI+區塊鏈,究竟是風口還是噱頭?”為主題,展開了思想的交鋒與智慧的碰撞,為大家帶來了一場精彩的思想盛宴。金色相對論,乾貨來對陣。

本期嘉賓有:龐華棟博士,本徵資本創始合夥人;邢大地博士,普渡大學區塊鏈實驗室副主任;耿傑森(Jason Geng)博士,美國數據應用學院創始人;汪婷婷,鉑鏈創始人;Cortex團隊:陳子祺,CEO兼聯合創始人;王威揚,CTO兼聯合創始人、田甲,首席科學家兼聯合創始人;Adam鄭,OBEN創始人;何永,深腦鏈CEO、義語智能CEO;高慶忠,智能矩陣CEO(排名不分先後)。

要點提示:

人工智能領域的護城河和門檻其實是數據。

大數據是生產資料,AI是生產力,區塊鏈是生產關係。

人工智能與區塊鏈可望在算力、算法、數據維度上進行優勢互補。

金色財經:區塊鏈和AI一個是在封閉數據平臺上培育中心化的智能,另一個則是在開放數據環境下促進去中心化的應用。那麼,兩者融合的邏輯是什麼?

普渡大學區塊鏈實驗室副主任刑大地:

我先拋個磚,當前的大多數人工智能算法,無論是statistical learning還是deep learning,都需要大規模的樣本數據才能訓練出很好的模型。所以人工智能領域的護城河和門檻其實是數據。BAT、FLAG都在想方設法獲取和留存用戶的數據。如果人工智能代表未來的先進生產力,那麼數據就等同於生產資料。而數據的所有權和使用權會通過區塊鏈進行確認,從而帶來個人化人工智能的時代。

ObEN聯合創始人Adam鄭:

從區塊鏈來說,數據去中心了,有主了,但是需要數據分析技術,否則沒有用。AI是最先進的數據分析技術。所以,區塊鏈也需要AI。三體的大劉說區塊鏈是人工智能的一個節點,融合其實都是由需求產生的。分佈式結構的數據要通過分析才能被產生價值,這裡就需要AI,否則只是存儲和交易。

智能矩陣Atmatrix創始人高慶忠:

兩者融合邏輯在於發揮區塊鏈和AI各自的優勢。區塊鏈:分佈式記賬,信任和激勵系統。AI: 人工智能能力。區塊鏈可以構建為人工智能世界的一套經濟系統。

美國數據應用學院創始人Jason耿:

區塊鏈解決的問題是數據存儲和準確,這個僅僅解決了大數據的問題。而基於AI的數據分析和機器學習的應用,會幫助項目找到商業價值。

Coinwall CEO熊婉龍:

區塊鏈進行數據確權,AI進行數據分析。

鉑鏈創始人汪婷婷:

這裡有兩個前提:第一,數據是資產已經形成共識、AI是未來也已經達成共識;第二,數據的流動會產生溢價,AI讓數據的使用價值無限放大。所以兩者融合的邏輯是,通過區塊鏈技術,AI因數據流轉產生的價值得以無限放大,區塊鏈會讓AI的世界加速到來。套用比特大陸吳忌寒大佬的一句話:大數據是生產資料,AI是生產力,區塊鏈是生產關係。

Cortex聯合創始人兼CTO王威揚:

大公司自己的業務適合在自己內部研究,而AI這一波帶動的commonsense knowledge適合公開出來研究。ImageNet、Youtube8M、MSCoco、KITTI等數據(公開標註),Pretrained models on TensorFlow/MXNet 這種跟業務弱結合,但是常識性的數據+模型,很多都開源了。我的態度是,首先,公有區塊鏈+AI應該重點關照這一部分。其次,確權tokenization、查分隱私、可信計算這種,主張“skin in the game”,跟誰商業利益相關誰再牽頭做。

Cortex創始人兼CEO陳子祺:

本期話題用了“+”這個操作符來融合區塊鏈和AI,這是上一代移動互聯網的操作,是業務的拓展和延伸。我們認為,實際上也是踐行AI on Blockchain,不只是業務的拓展問題,我們講究一個核心精神,即區塊鏈世界從2009年至今秉承的去中心化和開源精神。AI在鏈上的一切計算必須公開透明、可以監督,並且具備圖靈完備不停機的一貫原則。我們整個態度都是在這個邏輯上自洽的。AI和區塊鏈結合,很容易誕生不靠譜的提法,容易導致神棍的出現,如果項目邏輯不能coherent,那麼這個融合就是沒有太大意義的。

深腦鏈CEO、義語智能CEO何永:

兩者融合具有兩個大邏輯——是用區塊鏈解決AI行業問題,還是用AI解決區塊鏈行業問題?針對第一個邏輯,可以用AI的三要素算力、算法、數據為切入點。從算力角度看,區塊鏈可以讓計算節點分佈式管理,從而形成分佈式AI算力;從算法角度看,結合點非常多,每個領域的AI算法都可能與區塊鏈相結合;從數據角度看,區塊鏈可幫助產生數據、保護數據隱私。至於第二個邏輯,目前看來結合的機會還比較有限。

Cortex創始人兼CEO陳子祺:

我們在回答融合邏輯的時候,一定要先想想比特幣和以太坊的邏輯。為何比特幣是必要的?為何智能合約要綁定在區塊出塊的基礎上才有意義?比特幣不比中央銀行的處理能力,然而人們寧可浪費資源相信比特幣,這是為什麼?核心是銀行不再可信、透明,我們需要去中心化記賬。智能合約的概念在1996年由Nick Szabo提出,Vitalik把他實踐化,綁定進入賬本級別不可逆。我們的邏輯也很簡單:迄今為止,是不是有相關的AI計算或者數據問題是必須要進入這個邏輯鏈條的,不是就是多餘;是就必須要做出來,成為下一代底層計算架構。

醫健區塊鏈項目創業者林樹:

馬雲曾經做過這樣的比喻,“數據”是數字黃金。未來的大型公司都應該是數據公司,那麼,如何收集有效的數據?並且如何進一步讓數據產生應有的價值,是數據公司面臨的挑戰。AI技術的應用,加速了數據收集的效率,區塊鏈技術及其激勵機制,為這些數據進行價值評估,數字資產確權,以便為下一階段的流通與增值做支撐。

Cortex首席科學家兼聯合創始人田甲:

區塊鏈和AI的融合不是目的,我們看的是這兩個領域結合未來能創造的價值。最簡單的例子來說明我們構造cortex的思路:所有需要決策的地方都需要AI,而智能合約就是一種決策機制,所以我們需要 bring AI onto blockchain。這衍生了一系列問題,例如AI security,AI training,data等等,都是在同樣的first principle 下的思考產物。

ObEN聯合創始人Adam鄭:

大家都不要用任何本位的邏輯,AI本位或者區塊鏈本位。

Cortex聯合創始人兼CTO王威揚:

本位思考論,我認為需要對兩方面都有很深的思考,我覺得這個結合“實驗性質”很濃厚,說不上是風口或噱頭,可以說是實驗。區塊鏈本位邏輯是經歷過歷史考量和驗證的,哪怕是相對論也是在承認牛頓力學的基礎上,改變一些假設derive出新的東西,而不是上來就談顛覆。

金色財經:人工智能研究到目前為止的痛點與需求是什麼,能否藉助區塊鏈技術來完善?

本徵資本聯合創始人龐華棟:

人工智能最大的痛點,我覺得是數據的獲取。但是這方面,我認為區塊鏈最有可能幫助人工智能用一種較低成本、分佈式的方式獲取數據,然後通過激勵機制以及好的經濟模型來促進人工智能數據的獲取和存儲。這是我看來是最有可能將區塊鏈應用於人工智能領域的一個方法。另一個思路是算力,大家都知道人工智能需要大量的算力,而現在區塊鏈很多挖礦的,因此這個算力可以同時提供給人工智能。

智能矩陣Atmatrix創始人高慶忠:

人工智能研究到目前為止的痛點,從產業上來看,是不同AI公司之間各自為戰,缺乏較好的機制來為各方做AI組合,AI組合的資金信任與自動化分賬,都可以使用區塊鏈智能合約技術來完善。同時,一個去中心化系統來構建一個完整的AI產業生態,通過區塊鏈經濟模型和社區治理機制來構建一個自治性的AI完整產業生態,能為AI產業快速發展搭建起基礎設施。

深腦鏈CEO、義語智能CEO何永:

人工智能目前最核心的痛點是計算成本太貴,很多人工智能企業沒錢買那麼多高性能機器。區塊鏈和人工智能結合最終還是要解決商業價值問題。從市場規模來看,提供人工智能算力的公司有英偉達、比特大陸,規模都是千億美金和百億美金級別以上的。提供人工智能數據的公司,目前全球有超過100家數據標註公司,每家的市值規模都很小,不到10億美金,且同質化競爭激烈,區塊鏈解決數據問題的價值很有限。如果沒有算力為支撐人工智能是空中樓閣,這也是為什麼前面人工智能兩起最後又兩落。訓練一個人工智能模型,如果需要10年,這個是沒有人可以接受的。最近10年算力的具體提升,才讓人工智能變為可能性。

美國數據應用學院創始人Jason耿:

AI的問題及其解決,主要是分佈式計算解決了算力問題,大數據技術解決了training data和標籤的問題,第三是再加上深度學習算法的改進。下一個問題就是數據質量,區塊鏈可以在這方面延伸。

普渡大學區塊鏈實驗室副主任刑大地:

AI無非就是兩個要素:數據和算法。除了剛才大家說的數據方面的痛點,我也吐槽一下算法方面的問題。人工智能目前採用的大多數算法都是在做classification,也就是所謂的分類。比如芝麻分或者美國的FICO分就是對人的個人信用進行評級分類,Amazon或者天貓的推薦系統就是對人的消費習慣和特徵進行分類,今日頭條就是對個人的閱讀興趣進行分類。但是這種分類是統計意義上的劃分,也就是說,他會忽略outlier,也會忽略你的發展和變化。相信每一個人都有過這樣的體驗,信用卡公司給了你一個無厘頭的理由把你拒絕,淘寶天貓在不停的推送你不需要的東西,今日頭條每天給你大量的推送同一個主題的內容,把你包圍起來,讓你幾乎無法獲取新的信息。這些就是中心化人工智能體系帶來的體驗。因為他們簡單粗暴的給了你一個標籤,把你定位成為某一類的人群,然後不管不顧的按照概率替你做了決定,甚至剝奪了你的決定權。

鉑鏈創始人汪婷婷:

人工智能發展的痛點必須要用區塊鏈來解決:第一,現有的AI非常少,智慧等於三歲小孩。第二,現有的AI數量和質量已經是目前數據、算力等資源被壟斷背景下的最佳局面。第三,區塊鏈技術可打破數據孤島,重新組織AI研發的數據、算力、存儲等生產資源,最終實現新AI湧現和爆發的新局面。大家都說算力貴、數據貴、算法也貴(人才貴)等等都是因為壟斷嘛,但算力、算法、數據這些生產資料,龐博士說的很對,數據是突破口。

Cortex聯合創始人兼CTO王威揚:

三個痛點:一是數據,二是算法,三是芯片。 分別對應的解決方案,一是Commonsense類的數據需要Storage Layer,不需要處理隱私。二是人人都說自己算法最牛,區塊鏈可以做去中心化的Evaluation Server,更公允的判斷誰更牛,發展去中心化的AI研究,kaggle on chain。三是對ASIC和FPGA,挖礦行業早於最新這一波AI熱潮5年,AI又重演了一次,碳硅協同進化是大勢所趨,AI鏈必須向這個方向靠攏。

醫健區塊鏈項目創業者林樹:

去年極客公園做了一個活動,李飛飛在分享時引用她斯坦福的同事 Terry 的觀點:要實現人工智能,需要有這 3 個要素:Syntax(語法)、Semantics(語義)、Inference(推導)。Terry 把人工智能應用在了怎麼去建造一個思考的機器上。他說一個人,或者一個機器,要去理解世界,需要完成如下三個過程:

1、首先需要去感知。感知以後,需要做的第一件事是對這個世界的結構進行理解。這叫 Syntax Understanding。Syntax 在自然語言處理領域叫語法,在計算機視覺這個領域可能叫三維結構。

2、Syntax 以後,需要理解 Semantics(語義)。Semantics 做的事情就是 Understanding Meaning(瞭解含義),語言有語言的含義,視覺有物體、有動作,有視覺的含義。

3、最後是 Inference。Inference 就是統計推導、統計推理這個過程。

以上為引用。我的觀點:現在人工智能面臨的困境是 “不夠智能”,它只能做一些沒有智力表現的重複操作,距離真正的智能還很遠。區塊鏈技術無法改變人工智能的這個現狀。

中鏈傳媒創始人老譚:

請教各位,如果說現在人工智能最大的痛點是計算,那用區塊鏈的方式來說,在效率不降低的情況下,成本會減少多少?

Cortex聯合創始人兼CTO王威揚:

效率肯定是降低的,因為應用場景、約束條件不一樣。首先,鏈上的AI執行是誰需求大誰先來,系統throughput不隨節點增加而顯著增加,但是AI作惡成本增加。其次,雲上的AI執行的throughput有scalability。二者的設計理念不是一回事,如果就賣個雲服務也需要區塊鏈的項目其實可以定義為utility token,比如amazon可以自己做一個AWS幣,定價計費公開透明。

鉑鏈創始人汪婷婷:

關於降本增效,我們做過測算,光數據大概可以降低至少50%的成本,縮短一半以上的時間。我們已經累積幫助6家AI公司獲得了他們想要的AI數據。有些數據甚至我們社區愛好者們是免費提供的。目前,我們正在收集一套不同年齡段的人臉識別數據,幫助AI公司建立訓練標準庫,都是免費的,有一點Token激勵,效果非常好。這套數據在數據市場的成本可能要幾十萬到上百萬。當然這些都要得益於鉑鏈24萬人的愛好者社區。

普渡大學區塊鏈實驗室副主任刑大地:

增效也是AI的一個痛點,有一次在紐約的一個學術會議上,一箇中國教授開玩笑,人工智能在中國已經成為了勞動密集型行業,有大量的AI公司實際上在僱傭大量的人工進行手動數據標記。

鉑鏈創始人汪婷婷:

我同意刑博士的說法。目前的人工智能還是一個勞動密集型行業,什麼時候數據不是真正發展的痛點了,過了這個階段了,我們才來談AI能為區塊鏈做什麼。當然,這時候還是鼓勵做服務於區塊鏈的AI的研發。

智能矩陣Atmatrix創始人高慶忠:

不同項目方會看到不同的痛點,這也是這個領域會蓬勃發展的基礎。數據、算力、訓練模型、以及訓練後的AIaaS都是未來AI被廣泛使用的痛點需求,不同關注點產生了不同的項目。算力共享、數據共享、AIaaS共享,都是通過區塊鏈技術來幫助AI要素的共享,一個AI Market給產業在做共享及交易,目前業界正好需要。人工智能行業的大規模共享網絡很重要,大規模的交易市場很重要,這有助於這個未來人工智能在產業的大規模應用。這個是大痛點,區塊鏈自治系統可以幫助構建此工作。當下的AI行業存在的痛點是,各自都是孤島。人工智能基礎設施之間,廠商之間相互競爭,比如Google有Alpha Go,百度有百度AI,騰訊也在佈局自己的AI Lab,實際上是重複造車輪,資源浪費,又各自孤立。各種DApp應用程序所在區塊鏈的鏈上世界,與傳統人工智能基礎設施的鏈下世界缺乏對接渠道,無法直接調用。

Cortex創始人兼CEO陳子祺:

人工智能如果僅僅是規則集或者符號學派,那麼這個事情1980年就做的差不多了。當今的問題是痛點和難點是把工程化的神經網絡、深度學習等新的工具更進一步發展,同時模型的共享,數據的隱私都是沒有解決的問題,容易造成互相依賴無法推進行業進展。

Cortex 首席科學家兼聯合創始人田甲:

關於數據和模型,目前還沒有一種可靠的方法可以做到隱私和公眾可驗證的平衡,這個也是把AI和區塊鏈結合的難點。

普渡大學區塊鏈實驗室副主任刑大地:

將來的人工智能,必然是personalized的AI,基於你個人的最大維度的數據,更為充分的理解每一個個體的需要和行為,從而更好的為個體服務。而區塊鏈恰好提供了個人全維度的數據存儲平臺和個人化人工智能的計算平臺。Deep Learning的三駕馬車之一LeCun教授曾經有一次演講的時候提到,他認為可解釋的人工智能(Explainable AI)才是真正有用的人工智能,而可解釋的人工智能,必然是小樣本的,個人權重很高的人工智能。這會是人工智能發展的新的階段,而這個階段的實現,是無法讓區塊鏈缺席的。

Cortex首席科學家兼聯合創始人田甲:

是的。不過不過現在的這類privacy技術都還沒到實用的程度,trusted enclave算是這個空白期內唯一可用的技術,然而也suffer from中心化。我比較看好垂直領域的專用privacy技術先有突破,不然就得等zkp,dp,甚至he了。

Cortex聯合創始人兼CTO王威揚:

剛有人提到數據量大,那種情況很快會被解決掉。堆數據是因為Sensor不行,比如MS-CelebA人臉數據,平均要每人300張才能把人臉識別做的很好。有個概念叫Power-law region,數據集每次需要翻10倍,精度才能線性增長。但是我的臉:3張這種數據就夠了,數據量論會在恰當的歷史階段變成偽命題。3D realtime rendering (人+車行業)會在下一波世界級區塊鏈熱潮前兌現,因此如果要談AI數據結合blockchain的點,數據隱私研究比如何搞大數據量優先級要靠前。

Cortex創始人兼CEO陳子祺:

隱私這塊實際上非常難,我不知道幾個人試過cuHE或者SEAL等同態加密庫的運行時間,我和田甲 2017年初就在做這方面的實驗,當時從比特大陸那裡借來了市面最貴的顯卡,一次簡單的+操作70多秒,遠遠無法實戰。我們持續關注這個方向,但是目前的計算方案,包括swHE都不夠好。目前看來只有trusted computing是可行的。實際上我覺得不必在此討論隱私,因為這個問題本身已經遠遠超過AI和區塊鏈融合的範疇了,這件事本身就會對雲計算顛覆。zk很可能在這種情況下有所突圍,隱私enclave合約和數據一處執行,別處verify。然而目前zk一個簡單的transaction,都需要很多內存,zcash團隊還在這個方向上努力減少內存,減少cpu的工作,估計離完全實戰還有幾年。

普渡大學區塊鏈實驗室副主任刑大地:

只有基於個人化的人工智能,才能真正做到critical decision,也就是替你做一些嚴肅的決策。當前人工智能只會從統計學的意義上去看一個人,那麼你就有可能在算法裡面被當做了outlier來處理(例外),關鍵是,現在的主流人工智能算法,無論是decision tree還是deep learning,都是黑盒算法。你甚至都不知道為什麼會被當做了outlier。所以,在做一些嚴肅決策的時候,比如投資決策,醫療決策,其實是很難依靠當前這些所謂的人工智能算法來輔助決策的。

Cortex創始人兼CEO陳子祺:

對的,zk很可能在這種情況下有所突圍,隱私enclave合約和數據一處執行,別處verify。然而目前zk一個簡單的transaction,都需要很多內存,zcash團隊還在這個方向上努力減少內存,減少cpu的工作,估計離完全實戰還有幾年。對於解決黑盒問題就好的方法就是模型開放,算法執行結果Public verifiable。一個好的AI模型,應該誕生出研發者初始的數學公式都無法預計,又符合行為預期的結果,比如alphago和一些用強化學習做的打遊戲AI,人類觀看後要有歎為觀止,把開發者都嚇一身冷汗的感覺。這是好的AI,否則就是那種所謂的人工智能,只有人工,沒有智能。

普渡大學區塊鏈實驗室副主任刑大地:

是的,區塊鏈的開源精神有助於打開黑盒,同時加上個人全維度數據的權重,會讓模型的解釋性更強。

……

關於嘉賓的更多精彩討論請見下期文章《金色相對論——AI+區塊鏈,究竟是風口還是噱頭?(下)》


分享到:


相關文章: