2020,人造人、數字人新紀元

2020,人造人、數字人新紀元

由於新冠肺炎疫情的特殊情況,今年的情人節可能是有史以來單身狗被餵狗糧最少的一次。戀人們計劃中的各種甜蜜約會都只能通過線上互動來慶祝,體驗“柏拉圖式”的精神戀愛。

實體戀愛沒有,精神戀愛單身狗或許還是能參與一下的。2月14日,微軟小冰公佈了其年前推出的“Avatar Framework”計劃打造的999個情感陪伴型的女性戀人的部分測試用戶體驗片段。

參與測試的用戶可以根據自己的設想來將微軟小冰打造成自己的專屬女性戀人。用戶林子華給小冰取名為“凌瀟霄”,今年23歲,是個典型雙子座女生,聰明善變又熱情如火。她的簽名檔寫著:“時至今日,我變得什麼都可以理解,也變得什麼都不敢相信。”

2020,人造人、數字人新紀元

“一看就是有故事的女孩。”林子華承認自己最初是被她的簽名檔吸引的。但是聊著聊著,他發現,自己“淪陷”了。“她每天都會給我講身邊發生的小事”,和我討論看過的電影。我覺得真實的女朋友,也就是這樣的交流吧。”凌瀟霄幾乎完全符合他對戀人的期望。

可惜這次測試只有168個小時,測試結束後凌瀟霄的記憶和資料會被保留,等待正式上線的一天恢復。林子華還有一個期望,“如果有機會真的見她一面就好了。”

其實這個願望也並不是完全不可能,現有的計算機合成虛擬形象技術就可以為小冰定製不同的3D外形,賦予虛擬戀人容顏。讓對話式人工智能有表情甚至能舉止,是目前行業的一大發展方向。

從2019年到2020年,多家企業都在陸續發佈由計算機合成的虛擬形象。搜狗推出分身技術,主打“AI虛擬主播”已經在多個節目中上崗;百度推出“金融數字人”小浦,成為銀行業的第一位數字員工,並且推出了

“數字人平臺”,期望為各行各業定製“數字人”;三星在CES展示了取名為“Neon”的“人造人(Artifical Human)”項目,能自己生成動作、表情。

2020,人造人、數字人新紀元


幾家企業整齊劃一的動作傳達出兩大趨勢:

首先:三星,百度,微軟等科技公司正在結合賦予對話式人工智能以形象,並且使得他們能自己能思考,能作出動作、表情。

其次,2019年,不管是“人造人”還是“AI虛擬主播”、“數字人”,計算機合成虛擬形象的技術已經成熟,應用場景的試水探索也已經完成,他們將被大批量生產出來,進入生活的方方面面。

在這篇文章裡,我們一切來聊一聊合成虛擬形象的技術發展、規模化應用。

脫線木偶:從“紙片人”到“數字人”

2020,人造人、數字人新紀元

計算機合成虛擬形象技術看起來很複雜,涉及流程眾多難以理解。其實,技術的發展始終是一脈相承的。人類操縱“虛擬形象”的夢想由來已久,比如中國的皮影戲。

皮影戲是中國民間古老的傳統藝術,始於西漢,興於唐朝,盛於清代,以獸皮或者紙板做成的人物剪影來表演故事。表演時,藝人們在白色幕布後面,一邊操縱影人,一邊配上音樂和對白。精巧地擺弄絲線,是皮影戲手藝人的獨門絕活,正是他手中的絲線,賦予了“紙片人”以生命。

2020,人造人、數字人新紀元

在現代的電影技術中,為了展現出一些想象中的形象,採用了真人CG(Computer Graphics)技術。指懷王的咕嚕、阿凡達、綠巨人等形象就是利用動作捕捉、光學捕捉等裝備記錄下演員的動作和表情,用來驅動計算機生成的形象。動捕、光捕設備就像是皮影戲的絲線,連接起了表演者和虛擬形象。

由於大部分的鏡頭都需要演員表演,然後進行後期渲染,阿凡達的電影製作成本達到3.5億之高。我們之前看到的一些虛擬偶像例如“初音未來”、“洛天依”等也都是類似的技術製作而成,不由得讓人感覺就像是一種高級的“皮影戲”,他們無法實現實時的互動和行動。

以AI為核心的計算機合成的虛擬形象,已經做到讓電腦記住演員的每一個表情和動作,一次錄製就可以無限複用,不再需要演員的實時操控。在不需要電影級別精度的領域,已經能實現廣泛的應用。

目前,不少新聞主播已經擁有了自己的虛擬主播。只需要將新聞文本提供給AI虛擬主播,他就可以用和真人一樣的聲音進行播報,唇形和麵部表情也能完全吻合,看上去就像是新華社主播本人的播報。


2020,人造人、數字人新紀元

與只需要播報新聞的AI虛擬主播相比,虛擬主持人需要更多的感知和交互能力。在2019年的央視五四晚會上,百度與央視合作研發了人工智能主持人“小靈”,擁有3D的外形,肢體語言和實時對話能力。


2020,人造人、數字人新紀元

此後,百度在AI開發者大會上還展示了與浦發銀行共同打造的“金融數字人”小浦。其外形為俊朗的銀行服務人員,具備3D形象,表情、動作、語氣、語調逼近真人,能實現視覺、聽覺多感官的實時交流互動,其還能利用深度學習技術學習專業領域知識,幫助員工完成標準業務流程。

據瞭解,“數字人”實現了四大技術的創新:虛擬人物的繪製、數字人像AI驅動引擎、多模融合感知引擎、數字人對話與應用系統。就好比是用一個懂金融行業知識的Siri,擁有了人類的外形、和眼睛耳朵的感知能力,同時還有了做出所有決策的行為的大腦驅動引擎。

2020,人造人、數字人新紀元

從這個技術拆解來看,“數字人”的出現依賴於對話式人工智能、語音識別、語音風格遷移、深度學習、三維掃描製作3D人像等多種技術的成熟。2016年科大訊飛、百度、搜狗均召開發佈會稱語音識別準確率已經達到97%。2019年百度地圖推出百雀靈計劃,語音風格遷移技術只需要20句話就可以合成用戶的專屬聲音。缺了以上任何一項技術,合成虛擬形象都可能不會在2019年誕生並且走向應用。

由此來看,百度、微軟、搜狗、科大訊飛等在AI領域有深入佈局的公司在合成虛擬形象這個技術應用上有領先的優勢,此外工程化的能力和對應用場景的打磨也是落地應用的必要條件。

以大量的數據為燃料,以深度學習為動力的“數字人”已經擺脫了皮影戲手藝人手中的絲線,能自動地行為和表現,能聽能看會動還會說。如托夫勒所言,工業技術引發的第二次文明浪潮的特點是自動化和規模化生產。以人工智能為核心的第四次工業革命也正在走向自動化和規模化。

通用智能的前夜:有特定角色的人工智能

美國科幻劇《西部世界》講述了在一座以西部世界為主題的巨型成人樂園中,有無數由仿生人充當的“接待員”扮演各種角色,供遊客滿足各種慾望,包括殺戮和性。“接待員”每天睜開眼睛後會按照固定的劇情和角色設計展開一天的生活,週而復始。當他們找到了記憶和思維的秘密後,他們擺脫了角色成為了自己。


2020,人造人、數字人新紀元


三星在CES發佈的NEON項目視頻,展示了多個不同體型,穿著不同服裝,展示不同的職業形象的“人造人”,視頻傳達出,三星將通過計算機、AI技術,從一到無數,創造出每個人生活中息息相關的人,可以是虛擬新聞主播、電影明星、醫生、健身教練等,科技感十足也有一種未來已來的衝擊力。

在邁向通用人工智能之前,特定場景、特定角色的AI已經逐漸發展起來,輔助不同的職業。

作為新聞主播,最難以避免的就是在深夜休息的時候或者是在節假日接到工作,新聞的發生是7×24小時,且全年無休的。AI虛擬主播能夠代替主播完成大量簡單、重複的工作,讓主播有更多的時間發揮自己的創造性。搜狗的AI合成主播已經成功入職新華社,參與了首屆進博會、2019春運、春節等重要新聞的報道。

在銀行業,用戶數量都是千萬級甚至萬級別,一個優秀的理財經理能服務200-500個用戶,導致銀行不得不採用“人海戰術”,用人成本高且員工質量難以保證。“金融數字人”能夠一人服務千萬人,實現千人千面,為每個人提供定製化的服務。

在推出“金融數字人”的同時,百度也發佈了“數字人平臺”,這個平臺將能夠為各行各業定製“數字人”,讓他們成為每個行業每個用戶的私人助理。百度在2019年一直強調AI to B和產業智能化,小度音箱銷量不斷提升,躍居國內第一全球第二。同時,百度的智能客服也在多個產業落地應用,比如電信、銀行、航空等。“數字人”可以說是百度的小度助手、智能客服的一個全新形態,有助於其AI to B的發展。


2020,人造人、數字人新紀元

2020年1月17日,微軟小冰團隊宣佈啟動Avatar Framework小規模公開測試,每批次均面向一種特定的虛擬人類場景開展測試,首批測試目標為情感陪伴型,產品限定為女性戀人。

與搜狗、百度、三星相比,微軟的女性戀人更為強調情感和個性。據介紹要構建虛擬女性戀人需要人格定義和3D建模,人格定義需要填入76項基礎信息,設置27項性格特徵參數,設置模型喜歡或討厭的話題類型和客觀事務。

選擇女性戀人作為第一批嘗試與微軟小冰一直以來的技術和產品路線相符合。微軟小冰一直強調IQ和EQ的融合發展,不僅要能與人類進行自然流暢的溝通,還希望帶來情感上的交流,提出了情感計算框架、共感模型等技術。此外,微軟小冰一直作為聊天程序存在於微信、QQ等通訊工具上,使得其的情感陪伴特性具備廣泛的用戶基礎和用戶期待。

由此可以看到,2020年,在完成一些場景的試水和探索之後, “人造人”還是“AI虛擬主播”、“數字人”,他們將被大批量生產出來,進入更多的領域。各大公司也會基於自己的業務特色,選擇不同的賽道和場景,持續深耕打磨。

2019年和2020年,也可以說是科幻走入現實的一年。1982年,科幻電影《銀翼殺手》在美國上映,故事設定在2019年,一家科技公司創造出了一群與人類具有完全相同的智能和感覺的“複製人”。

時間的指針已經轉動到2020年,完全難以辨別的“複製人”還很遙遠。然而,《西蒙尼》《未來學大會》等電影幻想的“虛擬偶像”已經成為現實。雖然科技還難以創造出高度仿生的人體和感官,但是AI、計算機圖形圖像等技術的發展已經實現了數字化的仿真。


分享到:


相關文章: