百度大腦獻禮五四運動百歲宴,AI虛擬主播“小靈”背後有哪些祕密?

百度大脑献礼五四运动百岁宴,AI虚拟主播“小灵”背后有哪些秘密?

今年“五四運動”迎來一百年的生日,在中央廣播電視總檯主題為“我們都是追夢人”的 2019《五月的鮮花》五四晚會上為其獻上一份“新鮮”大禮,百度大腦AI虛擬主持人小靈首次亮相。作為“新新”青年的代表,小靈在舞臺上賺足了眼球,既能通過人臉識別技術與嘉賓互動,又有極強地控場能力。

小靈作為3D立體虛擬主持人,糅合了百度大腦的語音、視覺、大數據,以及AR等多重技術,其中最引人注目的是“唇動技術”。小靈的唇動技術,基於大量的面部特徵數據學習,輔之以人工智能和深度學習技術而形成的。小靈優秀的主持功力背後,究竟有哪些技術作為支撐呢?虛擬主持人將會有多大的發展前景呢?接下來我們細細剖析!

“小靈”臺上一分鐘,AI幕後做了哪些“十年功”?

小靈在從漫天飛舞的鮮花中走出來,站在主持人小尼和王俊凱中間熱情地與觀眾互動,活動過程中能夠發表自己的觀點,看似簡單的行為,背後少不了海量的數據支持和超強的人工智能技術運用。

首先,不得不提小靈的“唇動技術”。人說話嘴唇會自然而然地跟著運動,我們習以為常的事情對於AI虛擬主持人便沒有那麼簡單了。小靈想要達到能夠在說話的時候像人一樣自如地開合嘴唇,她一定要做好充足的準備。第一項準備事宜便是面部數據的蒐集,每一項人工智能技術的產生都需要大量的數據作為基石。

基於對海量的面部數據進行深度學習加之語音合成技術,便形成了我們看到的人工智能虛擬主持人“小靈”在晚會上能夠“真實唇動”。

其次,人臉識別技術更是現場最大的亮點。在與主持人小尼互動的時候,小尼想借用00後愛看的動畫片來掩蓋自己的真實年齡時,小靈並沒有“上當”。小靈通過人臉識別技術採集了小尼的人臉信息,並利用知識圖譜清楚地知道小尼的年齡。在小尼企圖用《喜羊羊與灰太狼》來欺騙小靈時,小靈迅速運用自己的“超級大腦”知識圖譜來反駁他說,《黑貓警長》、《葫蘆兄弟》才真正屬於他的年代。人臉識別+知識圖譜的技術讓小靈能夠在現場做到隨機應變,與此同時人臉識別技術還運用到了與嘉賓互動的環節。今年晚會上有一個有趣的測“花”活動,小靈通過人臉識別技術便可測出你是什麼“花”。

除了人臉識別技術,還有AR、大數據、語音識別等技術運用在小靈身上。“臺上一分鐘,臺下十年功”,小靈雖然第一次登臺,卻能夠落落大方、對答如流離不開各類AI技術的成熟與靈活配合。

AI虛擬主持人究竟能走多遠?

其實,小靈並不是首位AI人工智能主持人,在今年兩會期間搜狗與新華社聯合推出的“新小萌”和科大訊飛推出了“小晴”兩位人工智能虛擬主持人。兩會期間推出的兩款均可以找到原型,如新華社推出的“新小萌”是以新華社主播曲萌為原型。這類虛擬主持人通常是真人輸入語音,隨後對聲音進行標註和機器進行深度學習,以此構建出其發音聲學模型,在此基礎上,輸入任何文本便可進行語音合成,進而實現在線播報。本次五四晚會亮相的“小靈”是以二次元形象示眾,沒有明確的原型可以尋覓。與此同時小靈需要在舞臺上與其他主持人和嘉賓互動,和在線播報相比,小靈不僅要運用到語音識別的技術還要具備能夠在短時間內進行大數據運算的能力。對於虛擬主持人來說,技術發展有了進一步的提升,但很多人依舊存在疑惑,虛擬主播要來搶“播音員”的飯碗嗎?

人工智能作為一項通用技術,可以為了各行各業出現的問題提供解決辦法,對於主持人行業來說也不例外。首先,虛擬主播可以節省大量人力成本。

科大訊飛推出的“小晴”精通多種語言,可以在中文、日語、英語、韓語等多種語言中隨意切換,並且發音準確,十分專業。如何能夠將該項技術可以廣泛普及,在對外宣傳的節目中,專業、標準的發音能夠極大地提高傳播效果。此外,虛擬主播能夠在惡劣的環境中完成播報。眾所周知在各大事件發生時,記者總是要衝在第一線,掌握最新信息播報給大眾,但優勢環境過於惡劣或者人力難以到達的時候,虛擬主播或許能夠派上用場。在戰火紛飛的戰場通過無人機獲取最新情況後,虛擬主播可以實時播報新聞;地震、洪水等自然災害發生後,記者難以最先達到事故發生區,虛擬主播便有了用武之地。

虛擬主播隨著人工智能技術的不斷髮展,可以不斷解決行業內存在的問題。至於虛擬主播究竟能不能取代人類的擔憂,依舊是“杞人憂天”。人工智能技術是讓人類可以從繁雜、無聊的工作中解脫出來,而不是取代人類,真正有創造性的工作依舊需要人類自己完成。

小靈爆紅背後,少不了“百度大腦”的助力

我們已經瞭解了小靈在舞臺上出色的表現運用了哪些人工智能技術的同時,也清楚虛擬主播的未來存在著巨大的發展前景。但是一個產品背後的技術是錯綜複雜的,能夠讓技術在短時間內高效的工作少不了一個強大的支撐,小靈的靠山便是“百度大腦”。

百度大腦是百度 AI 核心技術引擎,包括視覺、語音、自然語言處理、知識圖譜、深度學習等AI核心技術和AI開放平臺,對內支持百度所有業務,對外全方位開放。目前,百度大腦AI開放平臺開放了171項技術能力,已吸引超過110萬開發者使用。除了百度擁有AI開放平臺外,騰訊、阿里、網易、英特爾、亞馬遜、科大訊飛均設立了AI開放平臺。

百度大脑献礼五四运动百岁宴,AI虚拟主播“小灵”背后有哪些秘密?

目前,國內的人工智能開發平臺分為兩類,要麼有強大的實力開發底層技術,要麼在細分領域有雄厚的技術支持。BAT巨頭的開放平臺開放技術豐富且底層技術多,而訊飛AIUI開放平臺、FACE++人工智能開放平臺等均是基於自身優勢不斷挖掘。

但是,目前的AI開放平臺存在著兩大問題,一是AI技術開放平臺的業務內容多於技術內容,這便與設立AI開放平臺的初衷背道而馳;二是開放平臺市之間缺少統一的技術標準和規則,導致底層技術差別不大,造成人力和物力的浪費。例如,百度開放平臺會涉及到語音技術,而訊飛AIUI開放平臺的語音技術更為深入和全面,兩者建立合作更為高效。

解決這兩大問題,AI技術開放平臺才能更好地發揮其作用。人工智能開放平臺是一個“橋樑”,一頭它連著開發者和研究機構,可以幫助平臺技術不斷實現迭代;另一頭連接著企業,可以將AI技術賦能到各行各業。根據清華大學發佈《中國人工智能發展報告2018》顯示,截至到2018年6月,全球共監測到人工智能企業總數達4925家,其中美國人工智能企業數2028家,位列全球第一,中國(不含港澳臺地區)人工智能企業總數1011家。2017年全球人工智能投融資總規模達395億美元,融資事件1208個,其中中國的投融資總額達到277.1億美元,融資事件369個。中國Al企業融資總額佔全球融資總額70%,融資筆數達31%。通過企業和行業投資的現狀來看,人工智能技術平臺的發展前景廣闊,因此標準的制定將是迫在眉睫。

在感嘆AI為我們生活帶來各種驚喜的時候,我們更要時刻保持一個探索的心,不斷追求技術革新,AI技術開放平臺正是一個很好的路徑。目前,中國人工智能企業的發展已經迴歸理性,並且今年兩會提出“智能+”的理念,要求中國的人工智能發展將要成為全國科技、經濟、社會發展和國家安全的全面支撐,AI技術開放平臺的日漸成熟是必然之路。


分享到:


相關文章: