產業智能化大潮來襲 王海峰揭祕百度AI大生產平臺

中新網10月27日電 10月26日,第九屆中國智能產業高峰論壇(CIIS2019)在西安開幕。本屆峰會以“驅動未來,智能無界”為主題,海內外知名人工智能學者、企業代表等參與峰會,圍繞人工智能技術創新和在各場景中的應用展開研討。百度首席技術官、ACL/CAAI 會士王海峰出席峰會,並發表題為《AI大生產平臺推動產業智能化》的演講,全面介紹百度如何通過探索頂尖AI技術、打造AI大生產平臺,助力產業智能化發展。

产业智能化大潮来袭 王海峰揭秘百度AI大生产平台

王海峰介紹,人類經歷的前三次工業革命中,驅動工業革命的核心技術都表現出很強的通用性,呈現出標準化、自動化、模塊化的工業大生產特徵。當前,我們正身處以AI為核心驅動力量的新一輪科技革命和產業革命浪潮之中,AI正將人類社會帶入智能時代。

作為國內投入最早、技術最強、佈局最完整的AI領軍企業,百度持續研發領先的AI核心技術,並積極建設AI大生產平臺,推動應用落地,促進產業智能化的發展。百度人工智能技術多年積累和產業實踐的集大成——百度大腦,實現了AI能力與應用場景融合創新,已升級為“軟硬一體AI大生產平臺”。

在數據和算力的基礎上,百度大腦“軟硬一體AI大生產平臺”以飛槳深度學習平臺為基礎技術底座,打通了人工智能產業化應用落地相關的全部流程,包括深度學習平臺、通用AI能力、定製化訓練平臺、部署與集成,以及應用的技術解決方案,同時有完整的AI安全體系保障,實現了AI技術的標準化、自動化、模塊化,推動產業智能化。

人工智能的發展離不開算力的支撐。百度大腦的AI計算架構,通過芯片、連接、系統和調度的協同設計和技術創新,提供百萬TOPS的強大算力,並緊密結合百度飛槳訓練與推理框架,提供面向算法優化的極致效率。

芯片是算力層面被關注的焦點。百度自研雲端通用AI處理器——百度“崑崙”,針對語音、自然語言處理、圖像等專門進行了優化,同等性能下將成本降低了10倍。此外,百度打造了遠場語音交互芯片百度“鴻鵠”,“鴻鵠”芯片按照車規級標準打造,採用HiFi4自定義指令集,雙核DSP核心,具備超大內存,包含TCMCacheSRAM,而且能耗極低,平均功耗僅100mW,可實現遠場陣列信號的實時處理和高精度低誤報語音喚醒,並集成離線語音識別功能,適配車載語音交互、智能家居等各種場景。

底層的芯片和上層的應用之間,還需要操作系統承接。在智能時代,深度學習框架向下對接硬件、芯片,向上承接各種業務模型、行業應用,起到承上啟下的作用,是“智能時代的操作系統”。百度在多年深度學習和人工智能技術的積累和產業實踐的基礎上,打造了自主可控的飛槳產業級深度學習開源開放平臺。飛槳平臺核心技術領先,具備開發便捷的產業級深度學習框架、超大規模深度學習模型訓練技術、多端多平臺部署的高性能推理引擎、開源開放覆蓋多領域的產業級模型庫四大領先技術;飛槳平臺集深度學習訓練和預測框架、模型庫、開發套件、工具組件和服務平臺等為一體,是功能完備、全面開源開放的產業級深度學習平臺。王海峰介紹,基於飛槳的EasyDL等服務平臺,企業和開發者即使不懂深度學習,也可以訓練出滿足應用需求的模型,加速AI的應用落地。

以飛槳為基礎技術底座,百度大腦的AI核心技術持續取得創新突破,保持世界領先水平。

語音技術領域,百度大腦的流式多級截斷注意力模型(SMLTA)使識別準確率提升15%-20%。王海峰現場展示了基於SMLTA中英文混合識別能力,這一能力目前已在的百度輸入法上大規模應用;風格遷移的語音合成技術把聲音中的音色、風格、情感等不同元素解耦分離,獨立組合,靈活控制合成的聲音,只需錄製20句話,就可以製作一個人的專屬聲音。基於此技術,百度上線了全球首個地圖語音定製功能,為用戶帶來了前所未有的個性化體驗。

在視覺技術方面,基於圖像技術、人臉人體技術和視頻分析技術,百度已經形成適用於不同應用場景的技術矩陣,如OCR文字識別、車輛識別、物體識別、風格轉化,以及人臉檢測、人臉對比、駕駛行為檢測、人流量統計等,在機械製造、金融、醫療、教育等領域得到廣泛的應用。而通過3D和AR的手段,已經實現人臉、手勢、環境、肢體多維度的技術突破,可用於一體化人機交互等創新應用。

綜合應用語音和視覺技術,機器可以自動合成虛擬形象。百度大腦的虛擬形象合成技術,首先對語音信號和視頻信號進行識別與理解,再通過唇動生成,以及語音、面部和肢體的合成,合成一個虛擬形象。

在語言與知識技術方面,百度建立了完整的、包含知識圖譜、語言理解、語言生成等在內的語言和知識技術佈局,全面支持搜索、問答、對話等百度產品,同時開放賦能,支持各行業的創新應用。百度構建了世界上最大的多元異構知識圖譜,在能夠滿足90%用戶需求的實體圖譜的基礎上,針對不同的應用場景和知識形態建立起關注點圖譜、行業知識圖譜、POI圖譜、事件圖譜等多種知識圖譜。

自然語言處理技術也在持續創新突破。百度結合知識和語義理解打造的可持續學習的知識增強語義理解框架ERNIE,通過建模海量數據中的實體概念等先驗知識,學習真實世界的語義關係。這種融合知識的語義建模大幅增強了模型的語義表示能力,在共計16箇中英文自然語言處理任務上效果超越了谷歌BERT和XLNet;在機器同聲傳譯方面,百度首創感知上下文的機器同傳模型,可以實現端到端實時同聲傳譯,翻譯準確率和時延與人類水平相當。百度構建的面向任務的理解與交互技術,現在已經積累了6.8萬個定製技能、累計交互570億次,在車載交互、地圖導航、智能音箱、政務諮詢等諸多場景中得到廣泛應用。

隨著AI技術的產業化應用不斷深入,AI安全也受到越來越多的重視。百度大腦打造了完整的AI安全體系,從基礎的開源技術矩陣、開放行業解決方案的平臺,到與學術界、企業、政府、機構等多層面的開放協作,為AI技術的產業應用保駕護航。

以百度大腦為核心,以飛槳為基礎底座,依託百度智能雲,百度大腦AI大生產平臺為各行各業的智能化轉型升級提供了強有力支撐。例如,百度聯合浦發銀行推出了金融領域首個“數字”員工小浦,憑藉專業的金融知識、對用戶需求的深刻理解,為客戶帶來全新的服務;百度的AI質檢技術應用於工廠的質檢車間,幫助人員成本節省90%,佔地面積減少80%,將漏檢率從0.5%-1%降低到0.1%以內;為重慶氣象局打造的智能預報預測系統,可以覆蓋短臨、短期和氣候預測,大幅提升氣候預報的準確率、縮短氣象預警信息的發佈時間。

目前,百度大腦AI大生產平臺已開放216項核心AI能力,日調用量突破1萬億次,開發者超過150萬,企業用戶發佈模型超過16.9萬個。

在峰會活動中,王海峰還參加了以“人工智能如何打破大規模產業化的瓶頸”為主題的尖峰對話。他以翻譯為例,介紹了人工智能的發展歷程,人工智能在當下科技變革和產業革命過程中的重要作用,以及百度在推動產業智能化面取得的成就。

談及人工智能的未來,王海峰表示,人工智能已經具備工業大生產特徵,將會開始廣泛的大規模應用,整個產業乃至整個社會都將從中受益。


分享到:


相關文章: