技術開源出現“逆趨勢”,中國如何下好 AI Open 這盤棋

技術開源出現“逆趨勢”,中國如何下好 AI Open 這盤棋

4月26日,清華109年校慶,計算機系舉辦AI Open 雲論壇,張鈸院士,李向陽校友(中科大人工智能學院院長)及唐傑、劉知遠、王小川(搜狗CEO)、唐文斌(曠視聯合創始人)就AI技術開源展開深入討論。

作者 | 蔣寶尚

編輯 | 賈偉

開源,曾經是最早一批互聯網創建者們所追求的自由與開放的價值觀,也是所有軟件工程師們的終極夢想。

2008年無疑是這份夢想革命性的爆發:GitHub開源社區誕生,作為一個開源的分佈式版本控制系統,能夠讓全球數百萬開發者參與開源項目,為協作寫代碼貢獻自己的力量。

從某種意義上,GitHub改變了人們對編程的認知,今天幾乎所有的程序員都離不開它。

技術開源出現“逆趨勢”,中國如何下好 AI Open 這盤棋

但是,在經濟出現逆全球化苗頭的同時,技術開源也受到了波及,如2019年7月份,曾有外媒披露“GitHub 開始限制被美國貿易制裁國家的開發者”。

其實,在2018年Github被美國微軟公司收購之後,便引發了對開源生態的擔憂,開源社區變成了公司資產,用戶上傳代碼,將會受美國的管理條例約束。

在貿易戰的背景下,中國可能成為被禁國家之一。

開源生態雖然是國際大勢所趨,但似乎也難逃“卡脖子”危機,Github存在被禁風險,我們如何發展自己的開源社區?在貿易戰中,我們如何平衡獨立自主與開源共享?

在 AI Open 雲活動中,張鈸院士表示:面對一系列的不確定性,中國必須進一步開放;王小川表示:疫情能夠加速合作的步伐;李向陽教授表示:我們要自力更生,但自力更生並不是要閉關鎖國。唐文斌說道開放不管是從利己還是利他的角度,都有好處。

1 科學研究從來都是開放促進步

不只是中國,整個人工智能領域近幾年發展如此火熱,得益於開放的研究環境,以及核心技術的無私奉獻。在清華大學建校109週年—計算機系雲活動·論道AI Open,張鈸院士提到:“科學技術發展的歷史表明,科學研究必須在開放的國際環境下面才能夠得到健康的發展,並造福於全人類”。

大家普遍認為人工智能誕生於美國,美國現在仍然處於全世界引領地位,但是這中間起主要作用的是全球科研機構的合力推動。

技術開源出現“逆趨勢”,中國如何下好 AI Open 這盤棋

以谷歌的 Alpha Go 為例,它產生的過程中間,主要貢獻不只有美國。Alpha Go前身就是DeepMind,其中創始的三個人都不是美國人。

裡面用的各項技術,例如神經網絡,或者說是卷積神經網絡也有各個國家研究人員的身影。神經網絡是1943年美國兩個人提出的,第一代神經網絡是日本人提出來的,第二代神經網絡是1998年法國人提出來的。

裡面用的主要算法,梯度下降最早是 Cauchy 1847年提出,現代加速版是俄國數學家 Yurii 1983年提出來的,反向傳播算法是1970年當時一個芬蘭碩士生提出來的。

蒙特卡洛樹搜索是2006年法國人提出來的。強化學習Alpha Go裡主要用的算法叫Q算法,Q算法是英國人提出來的。

整個圍棋程序是中國臺灣一個團隊編制。另外,深度學習的三個圖靈獎獲得者都不是美國人。

綜上 Alpha Go 的貢獻者有九個到十個國家,有美國、英國、法國、新西蘭、中國、俄國、日本、加拿大、芬蘭。這說明任何一個科學成就,都是全世界科技工作者共同努力的結果,特別是前人大量基礎研究的積累。

美國所有在人工智能領域長期處於引領的地位,在於他利用了開放的國際環境,使原來一些不是出生在美國的科技工作者,通過去美國學習和交流,最後定居美國為美國服務。

2 面對封鎖,中國應該進一步開放

既然美國是最大的收益者,為什麼美國要反對AI進行開放和國際合作?答案無疑是美國想阻止中國的科技崛起。

面對孤立我們的對策必須是進一步開放,深化中國參與國際交流合作的環境,正如張鈸院士在論壇中提到的那樣:“我們只有很好的利用開放條件,來發展我們中國人工智能科學和技術,只有把中國人工智能科學技術搞上去了,美國這種脫鉤政策才不可能得逞。”

但是,國際環境如此複雜的情況下,我們又不得不面臨是獨立自主還是開源共享的問題。最好的答案自然是兩者融合,既能保持自主性,也能貢獻開源社區。

但是兩者融合的“度”在哪裡,需要不斷的探尋摸索。從發展的眼光看開放全球一體化,越開放發展的速度越快。保持開放和自力更生是我們國家要努力做的功課,但是很多功課在這個之外。

正如搜狗王小川所說:“我們如何對外表達出我們的一種非進攻性,讓世界覺得中國的成功對世界是安全”。

保持開放的精神,自力更生的實力不僅要體現在技術領域,經濟文化方面上,都要表達出一種足夠的開放性、包容性,這樣才能促進良好的技術和經濟環境。

所以,“非威脅聲明”是保持進一步開放的外部條件。

另外,對於這個問題,疫情也能給我們一些思考。“兄弟鬩於牆,外禦其侮”,面對疫情這個敵人,全世界都應該團結,這是全人類共同的戰役,只有保持開放共享才能打贏這場戰鬥。這個時候如何談獨立、自主、控制顯然會帶來意想不到的傷害。

開放,不管是從利己還是利他的角度,都是有一定的好處。曠視唐文斌表示:開放和自主研發是兩個軸,不是一個選擇題。

當前,我們需要有更多的人才思考技術難題,某種程度上講開放的東西在哪裡,人才就會在哪裡。

從中國的角度看,需要做的是建設好一種開放的生態,把真正優秀的人留在國內的同時,把更多優秀的人吸引到中國。

3 開源越多,創業機會越少?

開源的技術越多,創業機會越少其實是一個誤區。首先要區分核心技術和應用技術,當前的很多深度學習算法,其實並不是核心的技術,更多是偏應用性的算法研究。

真正AI創業機會其實不在於核心環節,而在於它與產業的結合,即便是一個簡單的人臉識別,在手機場景下、攝像頭場景下以及門禁系統場景下都不是相同的技術。因為需要考慮的環境、光照不一樣,有很多問題需要解決,如果一旦深入到一個場景,問題就會變的完全不一樣。

把深度學習、強化學習等技術運用到一個具體的行業中去,如果沒有這個行業的知識,光是純技術,那麼所做出的產品就是一個偽命題。

所以,人工智能要想在某個領域應用起來,必須跟那個領域的知識相結合,不能單純靠數據,

張鈸院士提到的第三代人工智能最重要的方向就是把數據跟知識結合起來,例如想用AI弄清楚新冠病毒的源頭,那麼不能就數據論數據,必須跟理論知識結合,沒有任何數據知識找到準確的結果可能性很小。

張鈸院士曾經提到的關於第三代人工智能的理論框架體系核心思想:

  • 建立可解釋、魯棒性的人工智能理論和方法。

  • 發展安全、可靠、可信及可擴展的人工智能技術。

  • 推動人工智能創新應用。

及具體實施的路線圖:

  • 與腦科學融合,發展腦啟發的人工智能理論。

  • 數據與知識融合的人工智能理論與方法。

搜狗王小川談到:“只有領域的需求和領域的知識跟AI的結合,才是創業公司把AI作為解決方案需要掌握的能力,這時候光有AI技術是不夠的。”

“對於搜狗來說,原本想把語音的AI技術和語言的AI技術合在一塊,後來發現特別難,兩個架構不一樣,當做單獨做語音圖象的時候,發現能夠獨立實現它的目標,比如語音可以用到輸入法、錄音筆裡面,甚至可以作為一個平臺能夠輸出一個服務;但是到了語言級別之後就很難獨立輸出服務,語言需要深度理解業務場景,需要考慮用在什麼地方,是單純的問答?還是想做一個對話系統?最後發現組織架構需要跟業務深度整合,沒有特別多對核心上的研究需求,更多是在應用上貼的非常緊,因為領域知識要求更多。”

正是如此,當前的趨勢是計算機和人工智能方向與生物、醫學、化學深度交叉,才能助力相關的研發。AI如果跟相關領域知識結合,可以助力疫情的監控、預測、溯源。

開源越多,並不意味著創業機會越來越少,核心技術的不斷開源,才能夠助力各行各業的創業者找到適合自己的落地項目,從而實現多方共贏。

注:計算機系雲活動·論道AI Open 是由AI TIME主辦,其是清華大學計算機系一群關注人工智能發展,並有思想情懷的青年人創辦的圈子。AI TIME旨在發揚科學思辨精神,邀請各界人士對人工智能理論、算法、場景、應用的本質問題進行探索,加強思想碰撞,打造成為北京乃至全國知識分享的聚集地

AI 科技評論系列直播

直播主題:CVPR 2020丨數據與模型缺陷:不完美場景下的神經網絡訓練方法

主講人:Louis

直播時間:4月28日 (週二晚)19:00整

鏈接:http://mooc.yanxishe.com/open/course/797

直播主題:ICDE 2020 | 華東師範大學×滴滴:利用軌跡數據自動校準道路交叉口拓撲信息

主講人:劉國平

直播時間:4月29日 19:30

鏈接:https://mooc.yanxishe.com/open/course/810

直播主題:ICLR 2020丨從梯度信噪比來理解深度學習泛化性能為什麼這麼好

主講人:劉錦龍

直播時間:4月30日 (週五晚) 20:00整

鏈接:http://mooc.yanxishe.com/open/course/803

如何加入?

技術開源出現“逆趨勢”,中國如何下好 AI Open 這盤棋


分享到:


相關文章: