揭祕百度大腦:從支撐Apollo高速發展到成爲全行業的AI基礎設施

2018 年中國自動駕駛儼然進入一個快車道。在各地利好政策的推動下,自今年 4 月開始,上海、北京、重慶、深圳先後開啟了自動駕駛城市道路測試;今年 7 月的百度開發者大會上,李彥宏也兌現了一年前的承諾,基於 Apollo 平臺,百度和金龍客車合作的全球首款L4級量產自動駕駛巴士「阿波龍」正式量產下線。

揭秘百度大腦:從支撐Apollo高速發展到成為全行業的AI基礎設施

到了 8 月份,Apollo 繼續霸佔中國自動駕駛的新聞。比如和神州優車的合作,雙方將探索 10 萬輛級自動駕駛車隊的商業化運營,開始推行「自動駕駛+共享出行」的商業模式;而與長城汽車的合作,雙方將於2020年底實現自動駕駛汽車的量產,百度也成為長城WEY品牌的自動駕駛高精地圖和自定位技術的指定合作伙伴,這意味著百度成為國內首個真正實現了L3級自動駕駛高精地圖商業化量產的地圖提供商。此外,繼比亞迪後,長城汽車也加入Apollo開放車輛認證平臺。

事實上,Apollo 自誕生到現在不過一年半的時間,能在如此短的時間裡,不僅開放平臺更新迭代到 3.0,更是在技術、生態和商業化探索上取得不少令行業激動的進展,這當然得力於百度過去多年在自動駕駛領域的人力、物力投入,但鮮為人知的是,支撐 Apollo 平臺底層技術的“基礎設施”——百度大腦——發揮了巨大作用。

技術:從一輛車到一個平臺

自第一輛福特 T 型車下線後一百多年裡,人類從未放棄自動駕駛的夢想,而在本世紀初的幾年時間,人類似乎看到了實現這個夢想的機會。

2004 年開始,美國國防部高級研究計劃局(DARPA)連續三年組織了多次自動駕駛比賽,比賽吸引了來自全美多所名校的教授、學生。儘管有些組裝的汽車最終完成了挑戰,但人們也發現了自動駕駛落地的真正難點並非是研發出一輛汽車,更大的困難還包括如何降低成本,汽車廠商不可能讓一輛 200 萬美元研發成本的汽車成為大眾可以接受的車型;再比如如何實現量產,汽車作為一款交通工具,其首要考量的是安全性,那麼自動駕駛汽車是否能夠完全符合汽車行業對於安全的要求,所有這些都是未知數。

作為國內自動駕駛研究的先行者,隨著 2017 年 Apollo 平臺的成立,百度的自動駕駛開始了從一輛車到一個平臺的戰略轉變。

戰略的轉變也需要強大的技術支撐,百度大腦在這個過程中扮演了重要的角色。百度深耕AI多年,百度大腦首次亮相於 2016 年的百度世界大會,可以說是百度大腦是百度AI技術多年積累和業務實踐的集大成,包括視覺、語音、自然語言處理、知識圖譜、深度學習等AI核心技術和AI開放平臺。

揭秘百度大腦:從支撐Apollo高速發展到成為全行業的AI基礎設施

首先,自動駕駛汽車絕非「攝像頭+傳感器+傳統汽車」這麼簡單,而是一種駕駛理念的顛覆,如何讓汽車學會感知、學會規劃以及學會對不斷變化環境的反饋,這需要這個頂層系統的支持,也是擺在任何自動駕駛研發者面前的首要難題。

依託百度大腦,Apollo 平臺已經可以提供環境感知、行為預測、到規劃控制、高精地圖、高精定位等一整套完整的技術解決方案,這凸顯了百度大腦在AI核心技術的全面佈局和深厚積累。

其次,Apollo 作為一個開放平臺,需要承載不同廠商、不同車型的技術要求,這也要求底層的百度大腦具有更靈活、也更彈性的系統設計,尤其是,百度大腦如何應對平臺級別的技術調用需求。

不久前的開發者大會上,百度不僅發佈了百度大腦 3.0,提供了「多模態深度語義理解」的技術升級,還提出一個「用腦量」的概念,這是一個類似於今天用電量來形容一個產業的繁榮狀況一樣,「用腦量」也會成為判斷一個行業智能水平的標準。

百度高級副總裁、AI技術平臺體系(AIG)總負責人王海峰在今年的百度AI大會上介紹說,百度大腦現在每天的調用次數已超過4000億次,自去年 11 月到今年 6 月,百度大腦的技術調用量,也就是「用腦量」有顯著的增長,其中,語音技術日調用量增長94%,視覺技術日調用量增長了416%,人臉識別技術調用次數增長近8倍,NLP(自然語言處理)技術日調用量增長了180%。

上述這組數字展現了百度大腦的開放賦能能力,實現了從一輛車到一個平臺的巨大跳躍,而另一組數字則顯示了百度大腦以及所支撐的各種應用的進化速度。

速度:「中國速度」背後的底層支撐

2017年7月5日,百度Apollo平臺正式亮相併發佈1.0版本,兩個月後,Apollo1.5發佈。

2018 年 CES 期間,發佈僅八個月的自動駕駛平臺 Apollo 迎來 2.0 版本升級,從整體架構、安全性、感知能力以及模擬器方面都得到提升和優化。

七個月後,Apollo 3.0 在百度開發者大會上亮相,帶來了一個新架構、兩個新平臺以及四個量產解決方案的升級。

這一系列被稱之為「中國速度」的創新迭代之快令行業震驚,伴隨快速迭代的系統版本,Apollo 生態也從無到有、從一到多,快速成長為世界級的自動駕駛開放平臺。公開資料顯示,Apollo 平臺已經開放了 22W+ 行代碼,其託管在 GitHub 上的開放代碼數量在一年之內增長了 6 倍;而且,還被超過 10000+ 的開發者推薦使用;目前已經擁有 119家生態夥伴。

要支撐如此快速的自動駕駛發展需求,百度大腦是如何應對的?

其一,持續推動基礎技術創新。以不久前發佈百度大腦 3.0 為例,其核心「多模態深度語義理解」,就是對文字、聲音、圖片、視頻等多模態的數據和信息進行深層次多維度的語義理解,涵蓋了數據語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術。

這也意味著,通過「多模態深度語義理解」,機器可以在聽清、看清的基礎之上,更深入理解它背後的含義,深度地理解真實世界。

其二,進一步提升算力。某種意義上說,自動駕駛汽車就是一個「移動的數據生成器」,海量的數據需要實時計算,更需要低成本計算。今年,百度大腦在過往計算能力基礎上推出雲端 AI 芯片「崑崙」,專門針對語音、圖像、NLP 等計算需求,不僅能夠大幅提升計算能力,還能將大大降低計算成本,官方給出的數字是降低 10 倍。未來百度還將推出專門針對自動駕駛場景的AI芯片。

揭秘百度大腦:從支撐Apollo高速發展到成為全行業的AI基礎設施

這些基礎技術創新對自動駕駛發展的意義重大。正是利用上述基礎技術,Apollo將打通語音交互和視覺交互體系,打造出業內首創多模交互的小度車載系統。根據百度官方透露,目前可以在 30 天內完成小度車載 OS 在車上的一站式部署,直接讓傳統汽車升級為智能汽車。

進化:正在成為全行業的 AI 基礎設施

新技術之於互聯網公司,都要經歷從內部優化到外部賦能的過程。百度大腦很早就成為百度內部眾多產品,如搜索、地圖等產品的底層技術實施,將人工智能的各項能力注入到這些產品之中。

過去一年多時間,不管是自動駕駛平臺 Apollo 還是對話式操作平臺 DuerOS,其技術難度之大、行業影響之深以及快速迭代的需求,都是早先行業所沒有遇到的難題,也正如上文所言,在過去一年多的時間裡,基於百度大腦的 Apollo 在技術、商業和生態上取得的成績,恰恰反映了百度大腦作為人工智能基礎設施的可行性。

如果將視線放在整個人工智能領域,百度大腦還有諸多進化的可能性。尤其是 3.0 版本的百度大腦構建了從芯片到深度學習框架、平臺、生態的 AI 全棧技術佈局。

除了上文提到的芯片,百度大腦上的深度學習開源框架 PaddlePaddle 也更新到 3.0 版本,新版本在服務器和移動端進行了全面優化,可以適配更廣泛的開發需求。

其次,基於 PaddlePaddle 增加了三個平臺 AI Studio、AutoDL、EasyDL,進一步降低了開發者進入人工智能領域的門檻,比如 AutoDL 的目的是向開發者提供更普惠也更自動化的神經網絡架構,而EasyDL可以幫助開發者零算法基礎訓練業務定製模型,並提供可視化的操作。

第三,正如王海峰所言「我們研發最頂尖的AI技術,我們也致力於開放最頂尖的AI技術」,百度大腦已對外開放110多項領先的AI場景化能力與解決方案,這些能力和解決方案為各行各業的開發者甚至毫無編程經驗的入門者提供了一個可以改變世界的可能。

如果說 Appllo、DuerOS 是百度大腦面向汽車、人機交互提出的進化方向,那麼基於百度大腦,越來越多的開發者、大中小企業,完全可以結合自己的優勢和領域,開發出更多面向某個特定行業、領域應用,只有越來越多的應用落地,才能推動人工智能,尤其是中國人工智能的快速發展。

寫在最後

李彥宏不久前曾說過這麼一句話:「我們希望,今天,無論你在哪裡,無論你是誰,都能夠通過百度平等便捷地獲得AI能力。」如果把這句話放在百度人工智能發展的大框架裡看,我們會發現自動駕駛平臺 Apollo 是讓賦能自動駕駛行業,讓汽車領域的開發者、廠商平等接入自動駕駛,對話時平臺 DuerOS 則是要讓語音交互變成人人可以開發以及構建全新商業模式的底層技術。

百度大腦則更進一步,它在驅動上述兩個世界級的平臺,同時又在向全世界的人工智能開發者們開放新的能力和技能,這個全新的人工智能基礎設施正在讓自動駕駛的夢想成真,同時還將承載更多人類邁向智能未來的新夢想。


分享到:


相關文章: