曠視開源一小步,AI 基建一大步

進入 2020 年,新冠肺炎疫情襲擊中國各地,經濟不可避免受到衝擊。壓力之下,3 月中共中央政治局常務委員會召開會議,提出加快 5G 網絡、數據中心等新型基礎設施建設進度。

新基建,這一 2018 年被提出、2019 年被寫入政府工作報告的概念,頓時成為全民熱議話題。

它涵括了新能源汽車充電樁、特高壓、城際高速路和城際軌道交通、5G、大數據中心、人工智能和工業互聯網七大領域。這其中,後四項共同組成的數字化基礎設施,尤為引人注目。

旷视开源一小步,AI 基建一大步

數字化基礎設施建設的本質是什麼?5G、大數據中心、人工智能(以下簡稱 AI)和工業互聯網之間,又有什麼內在聯繫?

數字基建的本質

傳統基礎設施主要是“鐵公雞”(鐵路、公路、機場),為中國實體經濟發展打下了汗馬功勞。

旷视开源一小步,AI 基建一大步

從實體經濟到數字經濟,數字化基礎設施接過了“鐵公雞”的基建大旗,成為新一代經濟底層支柱。

疫情期間,數字化基礎設施已經展示了其影響力。

病原發現和藥物研發環節,AI 與大數據中心加速了基因檢測和蛋白質結構模擬的進程;疫情防控一線,基於 AI 和 5G 的機器人及設備在不少地方節省了人力,更高效更安全;復工復產後,工業互聯網幫製造業提升了效率。

種種應用場景背後,不難看出數字化基礎設施建設的本質,是通過通用的底層技術,把物理世界在線化、數字化和智能化,以提高數字經濟的生產效率。

具體而言,5G 和工業互聯網讓一切個人的、企業的設備在線化、數字化,生成了大量的數據;大數據中心提供了算力支持,是一切計算的基礎;而 AI 作為算法承擔了智能化的任務。

很多人都把數據比喻成數字經濟的石油,如果按照這個邏輯進一步類比,那算力就是燃料,算法就是煉油工藝——原油必須經過一系列工藝加工過程,才能得到有用的各種石油產品。

正如煉油工藝推動了石油時代的快速發展,AI 也代表了數字經濟時代的先進生產力。

那麼,AI 的基礎設施又是什麼?

手機的人臉識別,家裡的智能音箱,天上的無人機,路上的無人駕駛……新基建被提出的 2018 年,AI 產業已經在中國市場上蓬勃發展。

AI 產業鏈有三個層級:基礎層(計算基礎設施)、通用層(軟件算法及平臺)和應用層(行業應用及產品)。

益於龐大用戶量產生的數據紅利,以及豐富的應用場景,中國 AI 產業的發展更多集中於應用層。而在基礎層,依然缺少有競爭力的技術和人才。主流芯片(比如 GPU)和算法框架(比如 TensorFlow)話語權都被國外巨頭佔據。

對於這種情況,有專業知乎用戶這麼比喻道,這只是遊輪上的表面繁榮,水下是技術壟斷的冰山。一個被斷了電的遊樂場,即使別出心裁設計出再多新奇有趣的項目,又有什麼意義?

政府力推新基建,必然是希望產業和學界深入到 AI 的基礎層,而不是隻停留在應用層的表面繁榮。

旷视开源一小步,AI 基建一大步

那麼,對於 AI 來說,基礎層的設施又是什麼?

“只有 AI 芯片平臺和 AI 生產力平臺,能夠被稱為 AI 基礎設施。”2020 年 3 月 25 日,在曠視一場線上發佈會裡,曠視聯合創始人兼 CTO 唐文斌一針見血地指出。這場發佈會的主題是,曠視開源其深度學習框架“天元”(MegEngine)。深度學習框架通常被認為是 AI 的操作系統,上承各種業務模型、行業應用,下接芯片、大型計算機系統。

旷视开源一小步,AI 基建一大步

芯片平臺是 AI 的基礎設施,這一點毋庸置疑。就在曠視這場發佈會幾天前,業界傳出了騰訊進軍芯片製造的消息。

更早之前,阿里巴巴和百度已投入許久,前者依靠平頭哥造出了“含光 800”,後者推出了“崑崙”,覆蓋訓練和推理環節。就連一些靠算法起家的 AI 創業公司,也紛紛往產業鏈上游走,自己研發 AI 芯片。

AI 芯片的重要性已經被業界看到,而 AI 生產力平臺依然缺少足夠的聚光燈。

怎麼樣的平臺,才能被稱為AI 生產力平臺?唐文斌是如此定義的:“算法研發和普通編程不同,是一個系統工程,需要能夠協同優化數據、算法、算力的平臺級產品,我們把它定義為三位一體的 AI 生產力平臺。”

在他看來,曠視目前內部已經擁有了這樣的平臺,它誕生在 6 年前,叫做 Brain++。

Brain++ 由上述開源的天元發展而來。天元負責的是 AI 算法部分,它和 MegData(數據管理平臺)以及 MegCompute(深度學習雲計算平臺 ),一起組成了一個 AI 生產力平臺。

旷视开源一小步,AI 基建一大步

學術領域,曠視藉助 Brain++ 在獲得了 27 個世界級的人工智能競賽冠軍,其中包括 2017 年至 2019 年拿下 COCO 三連冠。COCO 是人工智能領域最具影響力的通用物體檢測挑戰賽,在計算機視覺領域享有很高聲譽。

而在產業方面,曠視依靠 Brain++ 佈局了個人物聯網、城市物聯網和供應鏈物聯網三個領域,並且扎得足夠深入。比如,在個人物聯網領域,Face++ 已經是人臉識別領域的行業標杆。在供應鏈物聯網領域,曠視的客戶心怡科技,藉助 Brain++,實現雙 11 當天拆零出倉八萬多箱貨物,刷新了單倉機器人集群作業的行業記錄。

小作坊和中央廚房

為什麼數據、算法和算力三位一體,就可以被稱之為 AI 生產力平臺?AI 的發展,又為什麼需要生產力平臺作為基礎設施?這要從 AI 算法的生產效率說起。

之前算法生產模式就像一個小作坊,它特點是一個大廚在裡面要幹所有的事,而且全手工操作,包括洗菜、配菜、調味。

對應到算法開發者,洗菜就是洗數據,配菜相當於選模型,後面的烹製、調味和裝盤,相當於算法訓練、調參數和部署。

整個過程費時費力,小作坊廚師一箇中午也許只能為三桌客人提供菜品,而且炒出來的菜好不好吃,完全取決於大廚的廚藝造詣。

好廚師終歸稀少,小作坊如果要做成連鎖店,就需要僱傭大量優秀廚師,成本極大攀升。類似的,企業實現 AI+ 的共性難題,莫過於無法解決場景過小而技術升級投入過大之間的矛盾,因此 AI 解決方案難以落地。

旷视开源一小步,AI 基建一大步

而 AI 生產力平臺好比一箇中央廚房,廚師將擁有自動洗菜機、智能化爐灶和智能鍋等套件工具,他一個人可以服務的桌數大大增加,而且味道有保證。

對應到 Brain++ 上,數據管理平臺 MegData 就是自動洗菜機,計算平臺 MegCompute 就是智能化爐灶,而剛剛開源的天元,就是一套集煎炒烹炸多功能為一體的智能鍋。

在 TensorFlow 還沒開源的 2014 年,曠視就開始著手研發深度學習框架天元。迭代到現在,天元這口“智能鍋”已經覆蓋了從訓練到推理再到部署全流程,不僅自帶菜譜(曠視自己的模型中心 ModelHub)還支持自定義菜譜(模型導入),並且配置了“動靜合一”的顯示屏。

旷视开源一小步,AI 基建一大步

所謂“動靜合一”,即動態圖和靜態圖兼容幷包。“我們經常聽說 TensorFlow 和 PyTorch 是兩個極端:PyTorch 採取動態圖,靈活方便好調試,適合學術科研;而 TensorFlow 採用靜態圖,利於部署,更適合工業界使用。”曠視副總裁謝憶楠說,“但是,產學研自古不分家,曠視想找到一個平衡點。”

因此,天元整合了動態圖與靜態圖各自的優勢,在充分利用動態圖模型訓練優勢同時,通過動靜態一鍵轉換功能,以靜態圖的形式完成生產和部署。此外,天元還支持動靜態的混合編程,靈活性更強。

藉助天元,開發者不再需要重複造輪子。有了這個“智能鍋”,AI 廚師可以把更多精力放在配菜(選模型)和調味(調參數)上,而無需過多關注底層細節。

值得一提的是,在天元之後,Brain++ 的 MegData 和 MegCompute 後續也會逐步開放給企業級用戶。發佈會上,曠視雲服務業務資深副總裁趙立威向業界展示了 Brain++ 商業化的全景。“我們不僅將把深度學習框架開源使用,也將開放數據能力、算力能力給企業級種子用戶,至少能夠先讓一部分企業實現 AI+。”

回到上文提到的一個難題:如果採用傳統模式,小作坊要做成連鎖店,就需要僱傭大量的優秀廚師,成本極大攀升。

採用中央廚房模式,小作坊能在成本可接受的情況下,開成連鎖店。類似的,藉助 AI 生產力平臺,企業要實現 AI+,不再受制於場景過小而技術升級投入過大的矛盾。

在上述發佈會裡,曠視雲服務業務資深副總裁趙立威舉了一個例子:一家制造業領域的工廠,在配電產品質量檢測中,會出現零部件顏色搭配錯誤、字符印刷殘缺等情況,靠人工目檢費時費力效率低,靠機器視覺方案就需要在數據、算法和算力投入大量的人力、物力,且模型效果難以維持。

曠視為客戶提供基於 Brain++ 平臺的智能質檢解決方案後,工廠實現了模型的快速選型、優化和封裝,極大地提升了質檢效率和生產效率。

這個案例也正體現了數字化基礎設施建設的本質——通過通用的底層技術,把物理世界在線化、數字化和智能化,以提高數字經濟的生產效率。

“MegEngine 中文名為什麼叫‘天元’?”這是很多業界人士的疑問。

曠視研究院高級技術總監田忠博說,“天元”在圍棋中,是棋盤的正中心。曠視希望用這種方式,來表達出 MegEngine 是曠視技術戰略大圖最核心的 “佈局”。同時也借“天元”之名指出,像 Brain++ 這樣的 AI 生產力平臺,作為基礎設施對整個產業來說都是非常關鍵的點。


分享到:


相關文章: