完美詮釋AI學術與產業的結合,一文讀懂百度王海峰的「開掛史」

今天,2018「吳文俊人工智能科學技術獎」頒獎儀式正式舉行。作為中國智能科學技術的最高獎項,這份含金量頗高的獲獎名單也代表了中國人工智能領域的最高榮譽。

這一系列獎項裡,「吳文俊人工智能傑出貢獻獎」側重那些在智能科學、技術與工程領域取得重大突破,貢獻巨大,並在國際上有較大影響力的智能科技工作者。

首個「吳文俊人工智能傑出貢獻獎」的獲獎者是百度高級副總裁、AI 技術平臺體系(AIG)總負責人王海峰。

完美詮釋AI學術與產業的結合,一文讀懂百度王海峰的「開掛史」

王海峰獲獎可謂實至名歸。翻開他的履歷就不難發現,王海峰既是百度高級管理者,負責百度整個 AI 技術的研發和對外輸出,同時他在 AI 學術領域,尤其是自然語言處理領域也有諸多建樹。更重要的是,除了橫跨 AI 工業界與學術界的背景,王海峰也在國際人工智能領域享有聲譽。

<strong>1. 學術研究

王海峰的人工智能研究始於大學階段。本科就讀於哈爾濱工業大學計算機系的王海峰,在 1993 年進入李生教授領導的機器翻譯實驗室,從此開始了機器翻譯及自然語言處理相關研究。

碩士期間,王海峰主導開發的漢英機器翻譯系統,獲得了國家 863 評測第一名及部級科技進步獎。而在1999年的博士論文裡,他已經開創性地探索了神經網絡機器翻譯的可能性。

完美詮釋AI學術與產業的結合,一文讀懂百度王海峰的「開掛史」

早期的工作經歷裡,他專注於自然語言處理和語音基礎理論研究,以及機器翻譯系統的研發工作。在當時,機器翻譯面臨數據規模以及計算力的限制,因此導致翻譯規則衝突、語料稀缺、多語種翻譯代價高和口語翻譯難度大的難題,王海峰提出了自己的解決方案。

其一,利用融合規則、實例和統計模型的多策略機器翻譯技術,解決了傳統規則翻譯系統人力開銷大、翻譯速度慢、詞彙覆蓋不足等核心難題。

其二,提出基於樞軸語言的翻譯知識橋接和模型橋接方法,從而有效解決了機器翻譯語種覆蓋度受限的難題,也讓原本語料稀缺的小語種翻譯成為可能。

其三,通過針對口語優化的中文語言模型,可以大幅提升口語翻譯的質量。

這一系列研究成果也得到學術領域的認可。2008年,王海峰主持研發的統計機器翻譯系統參加了國際口語機器翻譯評測比賽 IWSLT,在所參加的 5 項任務的 15 個評價指標中,共取得 12 項第一及 3 項第二的優異成績,凸顯出巨大的技術優勢。

2010 年,王海峰也迎來一次職業生涯的轉折點,這一年,他加入百度,正式進入人工智能工業領域。

<strong>2. 工業界的成績

加入百度後,王海峰先從自然語言處理的應用開始,逐步也將自己的研究方向拓展到語音、圖像、知識圖譜、機器學習、數據挖掘、推薦及個性化等領域。這既讓他擁有了豐富的 AI 應用場景經驗,也為百度人工智能的全面佈局奠定了核心基礎。

敏銳的技術洞察力以及高效的執行力,成為王海峰最重要的標籤。

完美詮釋AI學術與產業的結合,一文讀懂百度王海峰的「開掛史」

早在 2012 年,當工業界還沒有意識到深度學習的巨大潛力的時候,王海峰就已經觀察到這股技術趨勢。他帶領團隊開始將深度學習技術應用到語音識別、圖像識別,取得不錯的成績,一年後,深度學習被大規模應用在百度搜索。

王海峰也看到知識圖譜之於百度的重要作用。他主持研發了包含 6 億實體、3780 億事實的全球最大規模中文知識圖譜,並針對性地解決了傳統知識獲取規模小、成本高、效率低的瓶頸,通過面向開放域多形態數據的知識挖掘技術及高性能圖檢索和計算框架,實現了千億級知識的實時查詢和計算。

經過一番努力,百度在知識圖譜規模、圖譜數據容量及檢索性能等指標上均達到世界領先水平,這不僅對提升百度搜索有巨大幫助,也為百度接下來發力信息流、百度地圖和對話式人工智能操作系統等提供了重要的底層技術支持。

以搜索為例,2014年-2017年,王海峰出任百度搜索業務總負責人。基於百度在深度學習和知識圖譜的技術積累,他開始著手推動百度搜索技術的轉型升級。通過在融合知識圖譜和深度語義分析的需求理解、基於深度學習的層疊式搜索排序、語音語義一體化交互技術等方面的巨大突破,百度搜索實現了對用戶搜索意圖的深刻理解、搜索結果的精準呈現、以及與用戶間基於自然語言的便捷交互。

如今,智能搜索產品服務了 6 億多互聯網用戶,日均響應搜索次數約 60 億次,創造了巨大的經濟和社會效益。

2017 年 3 月,王海峰整合百度內部 AI 團隊資源,成立百度 AI 技術平臺體系,並任總負責人,同年兼任百度研究院院長。

新的組織機構進一步釋放了百度的人工智能發展活力,尤其是集百度人工智能技術之大成的百度大腦,它不僅是百度內部業務的 AI 技術基礎設施,同時也通過 AI 技術平臺向不同行業賦能,加速了人工智能技術落地應用的進程。

2018年,隨著百度大腦 3.0 的發佈,百度大腦突破了聽覺、視覺和語言一體化的語義理解技術難題,進入到多模態深度語義理解階段。目前,百度大腦的 140 多項技術能力已經通過 AI 開放平臺對外開放,日均調用量超過4千億次,極大降低了人工智能產業化應用的技術門檻,推進各行各業的智能化升級。

從學術界到工業界,王海峰不斷踐行著「讓更多用戶受惠於我的研究成果」的信念,他的成績也得到國際同行的廣泛認可。

<strong>3. 學術成就與國際影響力

截至到目前,王海峰已經在國內外頂級會議或期刊發表學術論文 120 餘篇,已授權或公開的發明專利200 餘項。

完美詮釋AI學術與產業的結合,一文讀懂百度王海峰的「開掛史」

作為一位中國學者,王海峰在全球自然語言處理領域開創了多個「第一」。2009 年,他成為自然語言處理領域國際頂級學術會議Association for Computational Linguistics(ACL)年會的機器翻譯領域主席,這是中國學者第一次擔任該職務。

與此同時,王海峰也是「ACL五十多年曆史上唯一出任過主席的華人,唯一來自中國大陸的ACL會士,ACL亞太分會創始主席」,ACL在授予他會士稱號時評價「王海峰在機器翻譯、自然語言處理和搜索引擎技術領域,在學術界和工業界都做出了傑出貢獻。」

王海峰的學術地位和影響力,也進一步增強了百度在全球人工智能的「江湖地位」,2016-2018 連續 3 年,百度大腦的核心技術都成為 美國 MIT 科技評論的年度「十大突破性技術」。

<strong>4. 寫在最後

如果從 1993 年算起,2018 年已經是王海峰投身人工智能的第 25 個年頭。在這四分之一的世紀裡,他見證了人工智能的起伏,也看到了人工智能之於互聯網、之於人類的重大意義。

25 年裡,王海峰所追求的,不僅是讓機器可以理解人類意圖,也是為了讓語言之間的障礙消失,更是希望將人工智能變成人人可享有的平等技術。

如今,王海峰的這些理念,正逐步落實到百度AI的發展過程中。作為最早對人工智能進行全面佈局的公司,百度也走在 AI 技術研發和產業化應用的前列,為全球十幾億用戶提供更加精準、便捷和高效的體驗及服務,並正在將這些技術賦能各行各業。(完)


分享到:


相關文章: