10.21 百度王海峰:人工智能是新一輪科技和產業變革的核心驅動力

搜狐科技報道

10月21日消息,第六屆世界互聯網大會人工智能論壇開幕,主題為“開啟智能經濟新時代”。

百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰在論壇上發言稱,人工智能是新一輪科技革命和產業變革的核心驅動力量。

百度王海峰:人工智能是新一輪科技和產業變革的核心驅動力

王海峰透露,百度AI大生產平臺的數據,已經開放216項能力,每天調用次數已過萬億,上面有150多萬開發者。

各位領導、各位專家,各位來賓:

大家下午好!

我跟大家分享的題目是《人工智能進入工業大生產時代》,我知道我們這個論壇的主題是“人工智能:開啟智能經濟新時代”,怎麼開啟?我的觀點是如果想讓人工智能能更快地、更有效地助力經濟的發展,需要讓人工智能真正像工業大生產的方式進入各行各業的生產環節,進而推動整個生產力的進步,也推動社會的進步。

為了論述我剛才講的工業大生產階段,我們先回顧一下人類歷史上已經發生過的幾次工業革命。我們都知道從200多年以前,人類歷史上已經發生了三次工業革命,分別為人類帶來了機械技術、電力技術和信息技術,而且每一次工業革命的核心技術都不是限於某一個行業,而是廣泛應用於各行各業,應用於人類的工業大生產,進而帶來了人們的生產方式、生活方式甚至思維方式的變化。

工業大生產的技術有非常強的通用性,另一方面這些技術也呈現出一些顯著的特徵,比如標準化、自動化和模塊化。所以,我認為一個技術有很強的通用性,它可以影響各行各業,同時具備標準化、自動化和模塊化的特徵,它就具備了進入工業大生產階段的一些基本前提。

人工智能是新一輪科技革命和產業變革的核心驅動力量。百度大腦是百度經過多年人工智能的技術積累和產業實踐的集大成,我們從2010年左右就開始佈局人工智能相關的各種基礎能力,經過多年的積累,在2016年形成初步完善的佈局,因而發佈百度大腦1.0。發展到今年,百度大腦不僅僅有很強的各方面的跟AI相關的軟的能力,從事也開始進入工業大生產的階段。一方面它更多地在跟硬件,比如跟芯片、硬件平臺進行結合,形成軟硬一體的平臺;另一方面,是我後面跟大家說到的這些技術也逐漸具備了標準化、模塊化、自動化的特徵,而且已經開始應用於各行各業,顯示出通用性。

百度AI大生產平臺的一些基本架構,有基本的算力和數據,同時有深度學習平臺,包括核心框架、工具組件、服務平臺;上面有各種相對通用的AI能力,比如跟人的視覺和聽覺、感知相關的計算機視覺技術、語音技術,同時也包括跟人的認知相關的自然語言處理、知識圖譜等基礎。在此基礎上,還要有定製的訓練平臺,比如面向各種垂直場景的應用技術進行定製化平臺,當然還要有適用於多種場景的多端部署能力,不管是雲上、端上還是邊緣上以及各種各樣的設備上,從而形成AI的解決方案。

我剛才講的第一點就是深度學習的平臺,我認為深度學習框架和平臺是AI時代的操作系統。為什麼這麼說?一方面它向下對接硬件、對接芯片,而且為了達到更好的效果,芯片是需要針對深度學習框架的技術進行定製優化,從而達到軟硬一體優化的更好效果;而向上,深度學習框架和平臺承接的是各種應用,這樣的話它處在一個比較核心的承上啟下的位置。所以,我認為它是智能時代的操作系統。

而百度的飛槳經過多年佈局,已形成完善的佈局,包括基礎框架,無論是開發、訓練還是預測;還包括產業實踐打磨的模型庫,也包括端到端的開發套件、工具組件和服務平臺。飛槳是一套很龐大的架構,如果提煉出其中幾個方面,是我們認為很重要很領先的技術,包括開發方面的開發便捷的深度學習框架,同時也有訓練方面能支持超大規模深度學習模型訓練的技術,包括多端多平臺部署的高性能的推理引擎以及產業級的模型庫。

開發方面,一方面是組網的編程範式更符合程序員寫程序的習慣,所以程序員開發起來非常方便,而且它同時支持動態圖和荊靜態圖,兼具靈活性和穩定性的優勢。另一方面,為了更好設計神經網絡結構,我們開發了自動化的網絡設計,現在這種基礎設計出來的網絡已經超越了人類專家設計的網絡的效果。

而超大規模的深度學習訓練技術已經能支持萬億級參數的訓練,而且可以做到實時的更新。

訓練出來模型以後,我們需要部署、應用,進行各種應用和推理,這時候涉及到多端多平臺的部署能力,而且為了在各種場景當中應用得更好,也做了通用架構推理速度的優化。

有了這些基礎的框架,無論是開發、訓練還是推理的能力,在真正應用的時候需要針對各種場景建構各種模型。這樣的話,飛槳也提供了非常全面的官方支持,經過工業產業驗證的工業級的模型庫,而且這種模型庫一方面在產業應用中得到很多驗證,另外一方面也參加了國際標準測試,得到了很多領先的結果。

深度學習有感知、認知技術,包括語音、視覺、語言和知識等等,這也是百度大腦具備的各方面的能力。語音的角度,我們最近研發的SIMLTA流式注意力模型,使準確率進一步提升,而且不僅在正常的比較安靜、標準的語音環境下能得到很好的識別效果,在嘈雜的環境或者中英文混讀的環境中也能得到很好的效果。如果大家平時會用語音輸入,會發現你只說中文,可能效果很好,但中英文混的時候效果就要差很多,這是由於語音識別技術所決定的。但是,我們現在不斷地提升模型,將兩種語言混合在一起仍然能得到比較好的效果。

而語音合成呢?如果僅僅能夠讓人聽清楚、聽得明白,這個事不是特別難,但如果聽得很流暢、很舒服而且有不同的音色、風格、情感等等,這些就變得很難了。我們研發的語音合成技術,把這些要素分別結耦、分別訓練,最後形成了統一的聲音。這時候不僅讓聲音的自然度更好,同時也可以進行各種定製。如果大家用過地圖的導航,知道一般地圖會提供一些標準的聲音,但你要想用你的孩子、用你的親人、用你的朋友或者用任何其他人的定製的聲音,其實這並不容易做到。但基於我們現在最新研製的語音合成技術,任何人只要對著手機到百度地圖說20句話,它就可以給你定製一個模擬這個人聲音的合成語。比如你開車的時候,就可以用你孩子的聲音幫你導航,幫助你去哪兒、要怎麼走等。

剛才講的是語音識別,接下來是語言相關的。語言相關很重要的一點是語義理解,而我們研製的可以持續學習的,而且不僅有深度學習技術在裡面,同時也經過了把知識、知識圖譜加進去的語義增強的理解框架,得到了非常好的效果。

同時還有交互的技術,比如說百度的對話式交互平臺已經有6萬多個定製技能,累計交互已有500多億次。

再有是兩種語言之間的翻譯,我們也首創語義單元驅動的上下游感知的翻譯模型,而且不僅翻譯得很好,同時實時性更好。

所有的百度AI技術,我們已經通過百度大腦開放平臺以及飛槳開源開放平臺全面開放,大家都可以基於這個平臺開發自己的產品、發展自己的業務。另一方面,我們也依託百度智能雲,可以更好地、軟硬一體地、包括數據、算法、算力結合起來,來部署這些AI能力。

當然,提到AI,安全也非常重要。百度AI安全方面也有一個完整的佈局,從基礎層到平臺層到生態層都有很多的佈局,大家有興趣可以進一步瞭解。

整體上百度AI大生產平臺現在的數據是這樣,已經開放216項能力,每天調用次數已過萬億,上面有150多萬開發者,有大量的模型發佈出來。

AI賦能各行各業,幫助各行各業進入工業大生產時代。時間關係,我不詳細講每一個點,大家可以看到不管是工業、農業、服務業各方面都可以受益於AI的能力。

謝謝大家!


分享到:


相關文章: