初窺AI版“未來簡史”

“人工智能和生物基因技術正在重塑世界,計算機和大數據將比我們自己更瞭解自己。”在2017年度“大眾喜愛的50種圖書”中,尤瓦爾·赫拉利的《未來簡史》榜上有名,這本書以宏大的視角審視人類未來的終極命運:人類,正一步步進化為神一般的存在,開始複製自身,創造新的智慧生命體。

人工智能是全球競爭的新焦點,而中國成為AI大秀的舞臺。2018世界人工智能大會(WAIC)上,最新AI應用紛紛亮相,來自世界各地的學者、產業精英共同探討AI產業發展,《未來簡史》中未來人類與AI的變化,從這裡可以一窺端倪。

AI什麼時候能進入2.0?AI下一代技術是什麼?AI能和哪些行業結合共同探索世界?

人類的未來已來,AI的未來尚需等待。

初窥AI版“未来简史”

算法2.0

下一個“深度學習”是誰?

半個世紀以前,麻省理工學院幾個計算機系的教授第一次提到人工智能這個詞時,他們以為人工智能是一個夏天就能解決的問題,但直到現在人工智能還是實驗科學。2016年AlphaGo對弈讓普通人意識到人工智能的魅力,其採用的深度學習方式在圖像識別和語音識別領域的成功,讓它幾乎成為AI的代名詞,短短兩年,人工智能技術已經應用到自動駕駛、機器人、醫療診斷等多個領域,深度學習成為人工智能熱潮的主力軍。

然而,深度學習的缺點也很明顯:對數據和算力要求高,而最終機器給出的結論是“黑盒子”,人們只能知其然卻不知其所以然。

“大概五六年以後,深度學習的算法可能會到達增長極限。下一波AI創新應該來自哪裡?”圖靈獎獲得者、清華大學交叉信息研究院院長姚期智在本次WAIC大會上提出了“姚之問”。

如何回答“姚之問”?

深度學習的“高門檻”

“能夠引領AI發展的頂級人才,環顧全球尚不足千人,這讓AI成為供不應求的搶手貨,只有AI的應用門檻降低到普通開發者甚至是業務人員也能做的程度,才能夠真正爆發。”第四範式的創始人戴文淵在WAIC上表示,據《全球人工智能人才白皮書》數據統計,目前全世界只有不超過 1000 家公司擁有能夠開發 AI 系統的人才,與此同時,更多公司卻擁有開發 AI 系統所需的數據。

屢屢在國際語音識別大賽中奪魁的科大訊飛,對深度學習的優劣也深有體會,其董事長劉慶峰在WAIC的不同論壇上多次表示,“深度神經網絡學習面臨著算法突破的挑戰,比如目前數據參數的設定都是手動,很多優秀的碩士、博士生只能將時間耗費在這種機械操作上,其次,深度學習對樣本需求量過大,能否有少量數據就可以學習,而且目前深度學習很難突破有監督訓練,未來能否變成半監督或者無監督訓練?”

劉慶峰指出的正是兩個深度神經網絡學習最難和最耗時的問題:處理數據格式化和培養深度學習模型,而這兩個難題在某種程度上阻礙了AI的普及,因為數據、算力、建模都需要耗費大量人力和資本,普通企業根本無力“AI化”,而這恰恰也是斯坦福教授李飛飛希望倡導“AI民主化”的緣由。

算法突破

AutoML實現“AI的民主”

從學界來看,遷移學習、冷撲大師、膠囊網絡等等新的算法都有可能在接下來的幾年中實現突破,但目前最早進入商業化、並且已經相對成熟的是基於遷移學習的AutoML。

可以讓機器自動建模、自動調參的AutoML被李飛飛稱為“AI民主化的重要進展”,因為它大大降低了AI使用者的門檻,每個人都可以利用AI技術自動生成AI應用,將企業的數據自動變為模型,整個機器學習過程是自動化的。

戴文淵以及第四範式的聯合創始人、香港科技大學計算機系主任楊強都是遷移學習領域全球排名前三的科學家。

戴文淵告訴《IT時報》記者,儘管在AutoML領域,微軟和谷歌都在2017年發佈了相關產品,但中國AI公司在這方面毫不遜色,前不久,國際人工智能頂尖學術會議NIPS正式宣佈,第四範式擊敗了谷歌獲得AutoML Challenge(挑戰)2018 大賽的承辦權。

國產“AI操作系統”時機成熟

戴文淵將第四範式的AI Prophet AutoML(以下簡稱“AutoML平臺”)定義為“AI的AI”,開發者無需深入理解算法原理和完成大量編碼訓練,只需做到“收集行為數據、收集反饋數據、模型訓練、模型應用”四步,便可以直接升級為AI開發者,這樣一個公司AI應用的開發週期從以半年為單位縮短至周級別。

或許將之比喻為“AI中的Windows”更容易理解,一家中小企業不需要去自己做一套Windows,而是在Windows上打開Office輸入數據便可以得到自己想要的答案。但對於科技創新而言,從0到1的路走得最難,軟件時代,中國國產操作系統半途折戟,AI時代,中國能有自己的AI“操作系統”嗎?

“操作系統能否成功,核心不在技術而是應用,軟件時代,所有的應用軟件也都來自國外,國產操作系統根本無力與Windows競爭,而AI時代,全球應用需求的中心在中國,我認為,國產AI操作系統的市場時機已經成熟。”戴文淵表示。

下一代人工智能要有推理能力

為什麼研究人工智能?基礎科學不太接地氣,澳大利亞科學院院士陶大程試圖用更形象的語言讓大家理解,他拿出一張畫面滿是人的照片問:誰知道照片中有多少人?會場近千名觀眾無人作答,有人下意識的開始去數,但通過人工智能技術,照片很快顯示出答案,3秒中檢測出920張人臉。

“除了圖片,現在的技術也能對視頻中的人物做人臉檢測、特徵點檢測,識別人與鏡頭的距離,甚至把視頻的背景檢測出來改成油畫和中國畫。人類通過眼睛看見這個世界,對周圍的事物有迅速的判斷和認知,如今我們做的是教機器如何變得像人類一樣聰明。”陶大程的主要研究方向是表徵學習,這也是人工智能領域非常重要的研究方向之一,包括多視角學習、多標籤學習、多任務學習、遷移學習、張量學習、噪聲數據學習等,這些研究成果被應用於計算機視覺、圖像處理以及生物識別技術等領域。

人工智能技術在向前行進過程中,總是遇到不同的問題,機器學習也像“盲人摸象”,看到某一部分,在已有信息的條件下做出最好的決策。“我們研究多視角學習,通過多個傳感器拍攝同一個物體的不同狀態,再彙總到一個平臺做出選擇。就像無人駕駛,有激光雷達、獲取視覺數據的攝像機,獲取聽覺數據的麥克風陣列等非常多的傳感器,之後把傳感器信息最終結合起來做出判斷。未來,能不能有一個上帝視角,讓機器知道自己看到的是一個物體的不同角度?”陶大程希望通過多視角學習來改善這一問題,把一些不同源、不同表達方式的信息整合起來,以改善後續的識別問題。

對於下一代人工智能具有什麼特徵,陶大程同樣用一張圖片舉例,通過圖片人物的著裝和神情,人類一眼即可判別圖片中的人在看球賽,“機器是能做到,但需要收集大量的信息才能教會它判斷,這樣的人工智能是我們需要的嗎?不是!下一代的人工智能應該有推理能力,也只能是推理的時代。”

算力2.0

無限向人腦靠近

對於AI的未來,調整算法固然可以減少對數據量和算力的需求,但根本而言,AI仍然是一個需要大算力的技術,尤其在生物、氣象等大自然領域,海量的數據依然要靠大型超算夜以繼日地運算,而量子計算和AI的結合,則很可能讓算力呈現爆發式增長。

初窥AI版“未来简史”

量子人工智能將真正認知自然

2000年,因為對計算理論的貢獻,姚期智被授予圖靈獎,而他的回國填補了國內計算機學科的空白。在這位年過古稀的老科學家眼中,量子物理是最美麗的物理法則,如果有一個足夠強大的量子計算機,也許有可能模仿大自然量子法則,從而理解自然智能。當人工智能與量子計算機結合,人們對世界甚至宇宙的探索會有更加深刻的認識, “深度學習的發展給了科學家一個如何看待計算機科學的新角度,是不是可以將量子計算和人工智能結合,進行量子人工智能,量子計算本身就能擴大了人類獲得知識、認知宇宙的能力,也許通過兩者的結合,人類可以真正有機會‘攻克’自然界。”

姚期智把著眼點放在量子人工智能不難理解,量子計算是他上世紀90年代開始主攻的研究領域。

拋去多粒子糾纏、量子比特、多量子系統等晦澀難懂的名詞,具有超快的並行計算和模擬能力的量子計算機令人興奮。量子計算機的計算能力有多強?有人打了個比方:如果將現在的計算機速度比作自行車,那麼量子計算機的速度就是飛機。

人工智能可與多學科結合

量子計算機什麼時候出現?何時能與人工智能相結合?對於看好這一產業的人來說,這是必須要思考的問題。迄今為止,科學家們還並沒有對開發量子計算機的最佳方法達成一致。面對場景多元化的人工智能,其他學科已經率先與之結合。

“人工智能剛剛開始,需要做的不只是把機器的計算能力再提升,還有許多科學問題亟待突破,要把心胸放大,深度學習需要和很多學科結合在一起,數學、計算機、神經科學等等。”姚期智說。

值得注意的是,學術界已經注意到交叉學科為人工智能發展帶來的更多可能性,開始匯聚計算機、統計、心理學、人文社科等領域的力量與人工智能相結合。比如,通信和計算機的交叉學科雲計算,把雲計算的運作模式與人工智能深入融合,可以把龐大的人工智能運行成本轉移到雲平臺,從而降低終端設備使用人工智能技術的門檻。另外,神經科學提供的神經網絡模型,對人工智能的發展也頗有貢獻,2018世界人工智能大會的學者不乏生物領域的專家,一些企業甚至已經喊出“神經科學是人工智能領域創新關鍵”的口號。

數據顯示,2011年,人工智能識別圖像的錯誤率是26%,2016年的錯誤率下降到3%,比人類的識別能力要高出2%,這樣的數字源於神經網絡和深度學習在人工智能領域的爆發。

類腦芯片讓機腦超越人腦

人工智能正在改變各行各業,而芯片是實現人工智能的載體,但傳統芯片卻遇上馮·諾依曼結構瓶頸。

目前,計算機採用的是馮·諾依曼體系結構,而滿足這個結構必須有一存儲器、一個控制器、一個運算器、必須有輸入設備和輸出設備用於人機通信,另外,程序和數據統一存儲並在程序控制下自動工作。有人將這稱之為“內存牆”,意思是CPU再快,也要等內存。

如今,越來越多的人工智能應用需要專門的AI加速器或計算卡,從業認識開始關注專門用於處理人工智能應用中的大量計算任務的模塊,與通用芯片不同,AI芯片主要用於處理專用任務,比如安防中高清視頻的識別、自動駕駛時的數據計算等等。這類的處理器主要分為GPU、FPGA、ASIC等類型,其中專用定製的ASIC芯片被認為是人工智能芯片的主要方向,寒武紀的GPU,地平線的BPU都屬於ASIC芯片。

值得關注的是,在ASIC芯片裡還有一個特殊的群體——類腦計算,正如尤瓦爾·赫拉利的《未來簡史》中傳達出的觀點,人類開始複製自身,幾十年來,科學家一直“訓練”電腦,使其能夠像人腦一樣思考,而類腦芯片就是模擬人類大腦處理信息的新奇的微芯片。

“為了應對各種認知任務,大腦要在短時間內保存和處理各種感興趣的信息,完成這個過程的大腦系統就是‘工作記憶’。工作記憶是形成語言理解、學習與記憶、推理和計劃等複雜認知能力的基礎。此外,基於生物層面的神經突觸信號傳遞作用機制、腦區間環路特徵、腦信息表達與處理、腦結構和功能圖譜、腦重大疾病發病的環路機制等成為研究熱點,這些都為人工智能的突破性發展提供了新的方向。” 在9月18日至19日復旦大學舉辦的類腦人工智能主題論壇上,復旦大學校長許寧生說。

研究表明,人類大腦平均每秒可執行 1 億億次操作,所需能量只有 10〜25 瓦特,如果讓一臺超級計算機來完成同樣的工作,需要消耗的能量超過人腦的 1000 萬倍。科學家們試圖通過模擬人腦運轉機制,利用神經元進行傳輸數據,使計算機能低能耗高功效地進行計算。

類腦芯片的研發非常困難,許寧生表示,復旦大學已經佈局了四年,期望通過腦科學的深入研究和神經機制的系統解析,“破譯”大腦信息處理與神經編碼的原理,再通過信息技術予以參照、模擬和逆向工程,形成新一代人工智能通用模型與算法、類腦芯片器件和類腦智能各類工程技術應用等新型研究領域。

異構計算

“後摩爾定律時代”的新選擇

“摩爾定律”究竟還能走多遠? 一旦摩爾定律正式成為歷史,半導體產業該如何繼續向前邁進?過去30年裡,集成電路的工藝進步經歷了多個現象級的飛躍提升,例如,工藝從毫米、微米、納米級進步,到現在的3-5nm工藝,接近現有電子材料及光刻技術的極限,然而,芯片廠商們突然發現,按照“摩爾定律”繼續提升芯片性能所付出的成本也變得越來越龐大,甚至已經成為當前集成電路行業面臨的最大挑戰:芯片設計和應用的編程開發越來越複雜,研發投入(IP、設計團隊等)和工藝製造越來越昂貴,而市場卻開始呈現碎片化的趨勢。

然而,在AI領域,卻呈現出另一種新的現象,不少企業紛紛宣佈推出自己的AI芯片,在本次WAIC上,地平線、寒武紀、酷芯等公司都展出了自己的AI芯片,且研究方向各有不同。記者發現,酷芯的AR8000系列芯片組,採用自己研製開發的無線通信協議,可以在4G等移動蜂窩網絡信號弱的時候傳輸高清圖像,2014年起,全球出貨的中高端民用無人機中,70%以上都是使用酷芯方案,而酷芯在WAIC上新發布的AR9201芯片組,是通信與邊緣智能處理的融合SoC(系統集成芯片),採用自主研發的遠距離無線基帶和射頻、高性能ISP (Image Signal Processing)、神經網絡專用加速器、視頻編解碼等核心技術;地平線的自動駕駛軟硬體一體化計算平臺Matrix則在WAIC上入圍了世界人工創新大賽,也是入圍該榜單的唯一一個軟硬結合嵌入式人工智能計算平臺,其二代自動駕駛處理器也已經基本成型,預計於明年1月流片,其算力從一代的1T提升至4-5T。

成本與需求的同步增加,使半導體行業越來越需考慮一個問題:能否通過芯片架構的創新,實現大幅提升性能和降低功耗的同時,顯著降低設計製造費用和芯片設計、應用編程開發的門檻,一個更小的設計團隊能不能完成複雜芯片的設計、應用開發的複雜度能不能大幅度降低。

在目前所有的架構創新中,量子計算、類腦計算等離大規模商用還有相當長的距離,而最近十分火熱的“異構計算”成為近年來架構創新的主賽道。

國內第一家從事下一代異構計算處理器芯片設計的集成電路企業華夏芯相關人士告訴記者,廣義來說,不同指令架構的計算單元(如CPU與GPU)之間實現高效協同計算都可以稱之為“異構計算”。全球異構系統架構(HSA)聯盟主席John Glossner認為,面對大數據、人工智能對計算性能的爆發式需求,各種創新的神經網絡算法及相應的計算實現架構層出不窮,傳統芯片設計架構已經難以滿足應用對計算能力的需求,因此以異構計算為代表的架構創新正在成為一個新的風口,並且正在成為新一代軟硬件計算體系和高端複雜芯片的主流設計平臺。

但由於產品設計難度大、生態系統需要重新構建等挑戰,在過去很長一段時間裡,異構計算一直處於不斷演進中,John Glossner認為,必須要走建立相關標準和規範、眾多廠商協同合作這一途徑。

在中國,異構標準化行動也已開始,由HSA聯盟成員中國電子技術標準化研究院和華夏芯(北京)通用處理器技術有限公司牽頭,組建了HSA中國區委員會(CRC),目前成員單位已有40餘家,涵蓋中國本土知名的半導體企業、高校和科研院所,CRC主要針對中國異構計算的實際需求,對HSA標準進行擴展、適配和修訂,這些工作成果將反饋回HSA聯盟,成為全球標準的一部分。


分享到:


相關文章: