深度學習平臺熱衷開源,作為先行者的百度飛槳樹立了怎樣的樣本?

2020 年的開年充滿了各種不確定性,但在人工智能領域,深度學習依然肩負著人工智能技術突破與行業落地的重任。

本週,引領國內AI開源的百度也首次向業界展示了基於飛槳(PaddlePaddle)的 PaddleCV(計算機視覺)全景圖,並帶來視覺能力的三大更新;曠視科技隨後也宣佈開源旗下的深度學習框架 MegEngine;過兩天,華為還將開源自家的AI計算框架Mindspore。

百度已是在深度學習領域耕耘多年的巨頭,華為在IT 界的江湖地位不用多說,曠視則是依託計算機視覺快速發展的行業新貴。不難看出,深度學習框架/平臺正在受到國內AI廠商越來越多的重視。其背後的考量,既有對於深度學習技術潛力的預期,也隱藏著對深度學習行業落地並賦能產業的雄心。

此時不妨拋出一個「X乎式」的模糊命題:如何看待當下國內深度學習開源平臺的格局?而要回答這樣一個宏觀的問題,需要先理解一點:為什麼開源開放的框架/平臺對於深度學習如此重要?

開源開放平臺對深度學習從業者意味著什麼

2012 年之後所興起的人工智能熱潮,離不開三大要素的支撐:算力、數據與算法。

其中,「算力」和「數據」是硬件摩爾定律與軟件互聯網服務發展的必然結果,而「算法」層面的創新則是作為機器學習子域的深度學習的技術突破——它解決了過往傳統算法無法應對的語音、圖像以及自然語言處理中的多個難題——從而成為學術和產業界的新寵兒。

深度學習平臺熱衷開源,作為先行者的百度飛槳樹立了怎樣的樣本?

公開資料顯示,2015 年 11 月,Google 正式開源 Tensorflow;2016 年 9 月,百度宣佈飛槳(PaddlePaddle)開源;2017 年 5 月,Facebook 給深度學習開發者帶來了 Cafe2。

無論是 Tensorflow 還是飛槳(PaddlePaddle),為深度學習從業者帶來多重價值。

首先,對於絕大多數開發者甚至企業而言,前文提及的「算力」、「數據」與「算法」幾乎也是三個無法越過的門檻,深度學習平臺則提供了一個類似「搭積木」的平臺。

通過將不同模型、算法以及數據集放在一起,開發者可以根據自己的需求,挑選適合自己的算法、數據集,最終快速訓練出一個模型,從而大大降低了深度學習以及 AI 開發的門檻。

其次,Tensorflow 與飛槳(PaddlePaddle),都是從自身複雜的業務體系裡抽離出的技術架構。換句話說,這些平臺上的技術(包括算法、模型等),已經在 Google、百度的複雜業務裡應用並得以驗證,它不再是停留在實驗室裡的「屠龍術」,而是可以應用在業務環境裡的實戰技能。

以飛槳(PaddlePaddle)為例,作為百度大腦的核心基礎,飛槳(PaddlePaddle)擁有開發便捷的深度學習框架、超大規模模型訓練、高性能推理引擎、產業級開源模型庫4大核心技術。

深度學習平臺熱衷開源,作為先行者的百度飛槳樹立了怎樣的樣本?

目前已經形成了從開發框架、開發套件到工具組件、服務平臺的技術和產品佈局,覆蓋了不同開發階段、不同業務場景的深度學習研發需求。這意味著,即便是個人開發者,都可以利用飛槳(PaddlePaddle)提供的平臺和能力,快速訓練、部署自己的深度學習模型,這種「站在巨人肩膀」的創新儼然成為 AI 時代軟件開發的潮流。

第三,深度學習開源平臺也是一個不斷進化的服務平臺。從 1.0 到 2.0,Tensorflow 小步快跑,不斷提升開源平臺的各項能力;而從 1.0 到 2.0 再到 3.0,高頻迭代的飛槳(PaddlePaddle),已經構建起完整的架構和產品佈局。

這些版本號升級的幕後,離不開 Tensorflow 與飛槳(PaddlePaddle)團隊工程師的努力,更是開源社區裡全球各地深度學習從業者們共同努力的結果。

作為行業先行者的 Google、百度,通過將內部的核心技術開源,並在與開源社區的不斷反饋中迭代平臺架構,Tensorflow 也好,飛槳(PaddlePaddle)也罷,過去幾年儼然形成了一條全新的「護城河」,對於後來者,譬如曠視和華為,沒有長時間的投入,想要跨過這條「護城河」的難度可想而知。

深度學習平臺之於產業與國家的意義

利用開源的深度學習平臺,越來越多的行業開始擁抱深度學習,技術突破之後的產業賦能探索,也在推動深度學習開源平臺的新發展。

在國外,從互聯網產品到醫療診斷,Tensorflow 等深度學習開源平臺不斷改變著這些行業的遊戲規則。

而作為最早應用深度學習的科技公司之一,百度不僅將深度學習應用在內部的搜索、語音輸入法、地圖等產品上,還在通過飛槳(PaddlePaddle)持續賦能各個行業。公開資料顯示,目前,飛槳(PaddlePaddle)已累計服務超過150萬開發者,擁有超過6.5萬企業用戶。

譬如在工業領域,大恆集團應用飛槳(PaddlePaddle)進行多種產品外觀質檢模型研發與部署,打造的質檢一體機實現了工業質檢效率的顯著提升,並已在在電池隔膜缺陷質檢產線上進行全面落地;在林業領域,北京林業大學基於飛槳(PaddlePaddle)打造的林業蟲情監測系統,可準確識別紅脂大小蠹,將原本需要兩週的檢查任務縮短至1小時,助力林業蟲害防治。

隨著人工智能持續而深刻地影響各個行業,深度學習平臺之間的競爭,儼然也成為國際競爭的重要領域,從 PC 到智能手機,掌握操作系統的幾家美國公司成為這個星球上最賺錢公司,還緊緊握著全球科技發展的「命脈」。

當近幾年國內 IT 行業「卡脖子」不斷上演的時候,百度飛槳(PaddlePaddle)一直「默默」肩負著推動中國深度學習開源生態發展的重任

早在 2017 年,由百度牽頭,聯合清華大學等多家機構,共同籌建深度學習技術及應用國家工程實驗室。依託這個實驗室,飛槳(PaddlePaddle)與國內多家科研機構及高校合作研發領先的深度學習技術,為中國的深度學習研究者、企業和開發者提供功能全面、技術領先的中國開源深度學習平臺。

其次,通過面向企業的「黃埔學院」、針對高校的「飛槳博士會」、「深度學習工程師認證」等舉措,構建中國深度學習開發者生態,2019 年的 WAVE SUMMIT深度學習開發者峰會上,百度還宣佈了 AI Studio 算力支持計劃,開放價值一億元的免費算力資源,助力開發者成功。

深度學習平臺熱衷開源,作為先行者的百度飛槳樹立了怎樣的樣本?

第三,飛槳(PaddlePaddle)與華為、浪潮的中國企業達成重磅合作。其中, 2019 年 7 月的百度 AI 開發者大會上,飛槳(PaddlePaddle)與華為麒麟芯片達成深度合作,將中國的芯片與中國的深度學習開源平臺緊密結合在一起。而百度與浪潮的合作,雙方將共建百度飛槳(PaddlePaddle)與浪潮AI Station 聯合方案,為深度學習開發者更便捷、高效地在浪潮AI服務器上應用飛槳(PaddlePaddle)深度學習能力提供了堅實基礎。

上述這些行業賦能與產業和合作的案例,凸顯出飛槳(PaddlePaddle)在國內深度學習開源領域的影響力,結合 IDC 2019 年的一份調查來看,在中國企業採用的業界深度學習開源平臺中,百度飛槳(PaddlePaddle)僅次於 Tensorflow 和 Pytorch,繼續成為推動中國深度學習開源平臺發展的重要力量。

寫在最後:深度學習平臺非一日之功

如果從 2016 年 9 月百度開源國內首個深度學習平臺飛槳(PaddlePaddle)算起,這個由百度開啟的新賽道在國內出現還不到四年時間,而在這個略顯動盪的 2020 年春天,曠視、華為、清華等企業、高校推出的深度學習開源框架,進一步助推了深度學習行業的熱度,也為中國發展自主可控的深度學習開源平臺提供新的可能性。

「新基建」的政策紅利下,國內產業智能升級的步伐持續加快。作為向下連接芯片,往上對接企業業務和行業應用的關鍵產品,深度學習開源平臺的重要性不言而喻,正如百度 CTO 王海峰所言,「深度學習框架是智能時代的操作系統」,也因此,未來這個領域的競爭還將持續。

但必須看到的是,面向深度學習的開源平臺「既不能一天建成」,也不能僅僅依靠某個突破性的技術而快速成功,它是將先進技術、行業理解以及生態協同結合後的「新物種」,Tensorflow 如此,飛槳(PaddlePaddle)亦是如此。

過去近四年的時間裡,飛槳(PaddlePaddle)從無到有,從小到大,一步步成長為紮根中國深度學習開發者並提供業界領先技術與產品的開源平臺,探索出了一條深度學習技術與產業深度融合的新賽道。

在百度開啟的賽道上,飛槳(PaddlePaddle)的技術迭代與行業落地實踐,為整個行業樹立了樣本,同時也為後續越來越多的國產化開源框架提供了參考。(完)


分享到:


相關文章: