“復活”馬丁·路德·金

“復活”馬丁·路德·金 | 鈦媒體深度

馬丁·路德·金的虛擬分身登上了《時代》雜誌封面

美國民權運動領袖馬丁·路德·金第六次登上了《時代》雜誌封面,2020年2月刊。

此前他曾先後五次登上封面,分別在1957年、1964年、1965年、2006年和2013年,但這一次完全不同,封面並非採用他的歷史照片,而是通過虛擬人技術創作完成的數字肖像。

與此同時,在芝加哥的 DuSable 美國曆史博物館裡,興致而來的觀眾們得以重溫這位領袖的激昂演說。

“I have a dream......”

戴上VR設備,體驗者彷彿“穿越”到了當年的華盛頓林肯紀念堂前,可以近距離觀察馬丁·路德·金演講的風姿,面部小細節也盡收眼底;置身於25萬來自不同種族的民眾組成的遊行隊伍中,觀眾甚至會有“擔心被人群踩踏”的親歷感。

這場沉浸式體驗展《大遊行》(The March),由好萊塢視覺特效公司數字王國聯合藝術家 Hank Willis Thomas 打造。藝術家和工程師們,通過全息投影、人工智能及VR技術等數字化手段,實現了“真人復生”,再現了美國曆史上的經典片段,前後歷時三年。

“复活”马丁·路德·金 | 钛媒体深度

馬丁·路德·金扮演者 Hank Thomas 在數字人制作中進行動作數據採集(來源:紀錄短片 The March

人類對於人工智能的想象從未停止。

從2004年經典電影《I robot》到最近的《Her》中的薩曼莎、《鋼鐵俠》中的賈維斯,人工智能不僅越來越智能,其形態、載體也不被侷限於機器當中——擁有情感的人工智能,哪怕只有聲音存在,也可以被看做是一個獨立的“人”。

在 2020 CES展出的創新項目中,虛擬人項目 NEON 吸引了全球的目光。

NEON由三星旗下獨立實驗室STAR Labs孵化,這個實驗室定位於“研發尖端 AI 技術與應用的核心平臺”。NEON項目負責人普拉納夫·米斯特里介紹,基於Core R3、SPECTRA兩大引擎,NEON虛擬人在對人物原始面部、聲音等數據進行捕捉並學習之後,可以自主創建未錄入過的新表情、新動作、新對話,甚至能說其他語言。

據米斯特里在 CES 的展出現場的介紹,CORE R3代表真實、實時、回應(Real, Realtime, Responsive),它使得NEON得以生成栩栩如生的真實, 並實時地做出回應。而另一個引擎——SPECTRA平臺,則負責提供情報,學習,情感和記憶,可以給 NEON 賦能,使得 NEON 帶給人的體驗達到“沉浸式”。

“复活”马丁·路德·金 | 钛媒体深度

栩栩如生、可實時回應的 NEON 虛擬人

STAR Labs將 NEON 虛擬人稱為“人工智人”,或是為了體現其與“機器助手”的概念不同。

STAR Labs戰略負責人Bob Lian在CES期間做客鈦媒體CES Talk to China Stage,他向鈦媒體App表示,“Neon所實現的100%真實感,在現在市場上是無可匹敵的。”

但由於技術引擎還在研發過程中,NEON在“智能化”方面還尚有欠缺。

“复活”马丁·路德·金 | 钛媒体深度

NEON虛擬人面部表情,說話神態以及眼部、唇部細節都非常逼真。

儘管 NEON 還處在非常早期的階段,TA的締造者們已經開始展望其商業化前景,“NEON可以擴展角色,變身為虛擬新聞主播、虛擬接待員,甚至是AI製作的電影明星。”同樣在中國,數字人的締造者們也已經嘗試進入服務領域、娛樂領域及影視製作行業。

數字人,何時能像科學家們所期待的一樣,成為我們日常生活的一部分?

科技公司的“造人”情結

不止 Star Labs 瞄準了模擬人類情感這樣的“造人”思路,近些年,各大科技公司越發注重對人工智能EQ(情商)的開發,希望能讓人工智能更接近人。

微軟人工智能小冰早在研發之初就強調人工智能的EQ將是重要的基礎。要在EQ的基礎上發展IQ、亞馬遜也希望其人工智能助手Alexa具備同理心、中國的科技公司百度也提出“智能體”概念,希望人工智能變得更有個性。

那麼,為什麼科技公司都希望“造人”?

來自三星 STAR Labs 的戰略負責人 Bob 給鈦媒體App的答案是,“數字人不會疲勞、不會厭倦,永遠能保持精力充沛。”

從交互層面,科技公司希望藉助數字人創造新一代人機交互方式。從生產力層面,藉助“擬人”化,AI能力,讓虛擬人能被運用在”需要大量重複勞動力、需要海量、複雜計算“的場景,解放人類勞動力,提高生產效率。

而AI技術的發展,讓計算機無論從軟件還是到硬件的“擬人”成為可能。

目前,業界將AI能力分為兩大類:一是感知類的AI能力,比如我們的耳朵能聽,我們的眼睛能看,這屬於感知類的AI能力;二是認知類的AI能力,比如我們的大腦能思考、能運算,認知類的AI能力主要是兩類技術:一是自然語言處理的技術NLP;二是知識圖譜。

感知和認知能力的落地,讓“虛擬人”與人類的交互有了更多可能。

如果說以往虛擬偶像的最大問題是不具備溝通能力,沒辦法真正像人一樣交流,那麼,感知、認知能力的提升,讓虛擬人不止停留在“徒有其表”的階段,而是真正的感知到外界,並像人一樣的交互、思考。

因此,這一波“造人”浪潮中,除了娛樂、交互領域,應用開始延展到更多實際場景中,虛擬主持、虛擬導購、虛擬前臺、虛擬客戶經理等實際落地案例都開始湧現。

成熟的技術廠商也開始準備入局。2019年進入下半程開始,我們生活中的數字人相關新聞開始增多,除了數家國內外科技公司都公開發布了數字人、虛擬人、或相關人工智能的研發計劃、開發者平臺,落地的應用也開始出現。

其中,一部分數字人應用致力於模擬真人。

最近的例子是2019年底的虛擬主持人妮雅,頻繁在各家科技媒體年度大會上亮相,一身紅衣賺足了眼球。

“复活”马丁·路德·金 | 钛媒体深度

搜狗虛擬主播妮雅在鈦媒體 2019 T-EDGE全球創新大會。

在 Baidu Create 2019 百度 AI 開發者大會上,百度聯合浦發銀行、原力動畫推出了數字虛擬人“小浦”。

浦發“數字人”計劃,應用於浦發銀行APP、網銀以及各類移動終端,還能融入到智能家居。鈦媒體App獲悉,“小浦”具有三項能力:一是情感感知,通過人臉表情識別技術,實時感知用戶情緒變化,讓交互溝通更自然;二是海量信息為用戶決策提供豐富的資訊依據,基於自然語言處理、知識圖譜等技術,結合金融知識庫和數據訓練,幫助用戶精細化管理個人資產;三是深度學習,數字人通過實施服務,積累服務經驗,為客戶規劃未來提供支持。

“复活”马丁·路德·金 | 钛媒体深度

數字虛擬人“小浦”

同時,“智能”也賦予了虛擬卡通形象更大的生命力,特別是人工智能在視覺與圖像上的進步,讓虛擬偶像們翩翩起舞、與人類互動。

B站被贊爆了的跨年晚會上,B站“親閨女”洛天依就與國樂大師方錦龍的同臺表演《好一朵美麗的茉莉花》,為用戶提供了全新的視覺體驗。

琵琶聲中,舞臺效果也呈現出春夏秋冬四個季節的景象,洛天依則輾轉在四季景象中,時而撐起油紙傘,時而登上游船,又在楓葉和雪景中舞蹈……

“复活”马丁·路德·金 | 钛媒体深度

洛天依就與方錦龍的演出,洛天依並沒有真實出現,主要依賴於AR增強現實技術而實現

不少虛擬人社交產品,也在2019年濺起了水花:可將自己錄製表情的Memoji表情等應用、可以模仿真人表情的虛擬人社交產品ZEPETO、可以將自己的臉換到明星身上的ZAO等等……

如果再將虛擬人的概念往外延伸一些,小度、小愛、小冰、天貓精靈、Alex等有性格的人工智能助手,也逐漸形成了自己的數字人人設。

多家在虛擬人項目上已經小有突破的頭部科技公司均接受了鈦媒體App採訪,他們的產品和研發思路不盡相同,但數字人在行業中的應用趨勢,已經相對清晰。

騰訊AI Lab“虛擬人”項目

——定性為前沿研究項目,應用偏娛樂、內容方向,與騰訊業務結合緊密,將融入騰訊的文娛生態

作為NEON的“前輩”,早在2018年Siggraph會議上,騰訊互娛NEXT技術中心和騰訊AI Lab就攜手發佈了高保真可交互數字虛擬人Siren AI。

“我們認為,虛擬人是基於AI前沿多模態研究,可以具備個性、成長性、主動性甚至創造性,能迸發出極‘智’想象力的下一代智能人機交互方式。”

騰訊AI Lab 副主任俞棟博士接受了鈦媒體App獨家專訪。他正帶領騰訊“虛擬人”項目進行一系列前沿探索。在問及“虛擬人”的定義時,他這樣回答道。

“复活”马丁·路德·金 | 钛媒体深度

Siren AI

同NEON一樣,Siren AI的面部形象同樣來自於真人——中國的女演員姜冰潔,但“她”可以在AI大腦的輔助下,由其他人驅動。

“复活”马丁·路德·金 | 钛媒体深度

Siren所有的動作表情都是實時捕捉並實時渲染。也就是說,其他人可以通過驅動虛擬人來“還原”姜冰潔本人,完成一系列表演。

“复活”马丁·路德·金 | 钛媒体深度
“复活”马丁·路德·金 | 钛媒体深度

但Siren AI依然需要真人來驅動,因此,騰訊AI Lab在此基礎上,發佈了多模態合成系統DURIAN。

多模態合成系統DURIAN,它可以合成高擬真度的語音並同步預測唇形和表情參數,這些唇形和表情參數通過虛擬形象驅動算法讓虛擬人有擬人化的表情和肢體動作,也使得虛擬人可以擺脫對動捕演員和聲優的依賴。

作為DEMO,騰訊將這項技術落地到了電競解說上,發佈了代號名為“T.E.G”的卡通AI形象天鵝靜。目前,AI天鵝靜在企鵝電競上已經開闢了直播房間,不斷更新解說視頻。

“复活”马丁·路德·金 | 钛媒体深度

目前,天鵝靜還處於內測階段,但每日都會“上崗”直播(圖片由受訪者提供)

除了擺脫動作捕捉及對聲優的依賴,俞棟表示,電競虛擬人克服了樣本較少、評價主觀、知識依賴等問題,可以從新聞報道和人類解說中不斷地學習局勢分析和解說的能力,並將這些能力舉一反三,是騰訊虛擬人技術的一大突破。

除了卡通角色“天鵝靜”之外,騰訊AI Lab還在今年多個會議上展示了基於神經網絡渲染的寫實數字人“小航”。

該數字人只需要運用發言人不到10分鐘的視頻數據,就可以定製而成。騰訊AI lab計劃將“小航”數字人應用在教育、主持等場景。

“复活”马丁·路德·金 | 钛媒体深度

騰訊AI Lab基於神經網絡渲染的寫實數字人“小航”。

事實上,除了塑造虛擬人外觀形象,驅動面部表情外,在人體圖像合成、動作遷移等多方面,騰訊AI Lab都已經有深厚的技術積累,許多和虛擬人相關的技術都在研發當中。

“复活”马丁·路德·金 | 钛媒体深度

上海科技大學和騰訊 AI Lab 推出的一項最新研究,能讓AI做到近乎完美的動作遷移,這項研究還可以實現實時變裝,3D 建模等功能。

“复活”马丁·路德·金 | 钛媒体深度

儘管騰訊 AI Lab 將虛擬人項目定性為前沿研究項目,但由此研發出的前沿語音合成技術,已經在騰訊內多個業務落地,包括了電視、音箱到王者機器人產品等等。AI Lab相關人士對鈦媒體App表示,未來虛擬人也會以電子偶像、電競解說、新聞主持等不同的形式和騰訊的業務進行結合。

微軟小冰

——幫助虛擬人“更像人”的人工智能底層框架

與NEON的情感路線類似,微軟小冰早2014年研發之初,就提出了專門發展AI的EQ,基於EQ迭代IQ的理念。雖然沒有實體的機器人,但如果從虛擬人的“類人”功能來看,微軟人工智能小冰是最接近人的,也是最早提出多模態的廠商之一。

2019年,微軟小冰升級到第七代,已成為全球最大的跨領域人工智能系統之一。在全球多個國家,微軟小冰單一品牌已覆蓋6.6億在線用戶、4.5億臺第三方智能設備和9億內容觀眾。

微軟小冰人工智能技術路線比較特殊,以情感計算框架為核心,在“類人”(EQ)上延展人工智能技術,讓人工智能和人類一樣具備情商的同時,也在探索人工智能創造力的發展。

在寫作、畫畫方面,微軟小冰已經達到“原創”的水平,出版數本擁有著作權的詩集。

小冰創作的現代詩,是“她”通過對1920年後519位現代詩人的上千首詩經過萬次的迭代學習達成的,需要圖像的激發,根據誘發源而做到“有感而發”:

《她嫁了人間許多的顏色》

看那星閃爍的幾顆星

西山上的太陽

青蛙兒正在遠遠的淺水

她嫁了人間許多的顏色

而小冰團隊也在基於框架衍生出賦生其他人工智能。2019年,小冰團隊開了一個由首個人工智能畫作組成的個畫展。

畫展上展出了基於框架虛構的基於小冰框架,衍生出7位畫家的作品。來自於不同時代的虛擬畫家。(詳見鈦媒體App前文:微軟小冰學會畫畫了,還要辦個人畫展)

“复活”马丁·路德·金 | 钛媒体深度
“复活”马丁·路德·金 | 钛媒体深度

上述繪畫模型,會大量使用誘發源,不是讓機器把一種已有的視覺元素轉成另外一種風格重新生成,而是要求在誘發源的幫助下,激發人工智能進行重新的創作,這是這個模型最顯著的特點。

完整的人工智能底層框架,得益於小冰團隊在計算機語音、計算機視覺、自然語音處理以及搜索引擎和知識圖譜的全技術棧優勢。

在2019年年末的一次Workshop上鈦媒體App瞭解到,小冰團隊在自然語言處理、語言學研究、計算機視覺及圖形學、多模態生成等方面都取得了階段性成果,未來有望賦能給行業。

“复活”马丁·路德·金 | 钛媒体深度

在自然語言方面,該人工智能框架可以與人進行多輪自然對話,對話輪次達到23輪(業界最高),並且是人工智能主導對話,還具備“三觀”系統,已經形成了態度檢測、情緒模型等。此外,小冰團隊還在嘗試讓人工智能之間能夠實現互相學習。

微軟小冰首席NLP科學家武威認為,基於三項能力——1,向人類、向其他人工智能學習;2,能夠自主管理、把控對話流程;3,具備連結能力,能夠連結散落的多模態知識,小冰的人工智能框架正在朝向自我完備型對話機器人進化。

“复活”马丁·路德·金 | 钛媒体深度

多輪對話,很多語音技術服務商都在深耕於此,而武威告訴鈦媒體App,“小冰是最早推出全雙工語音(full-duplex sense)並在智能音箱等場景中進行產品化落地的。” 他還介紹,小冰框架的對話引擎,已經從行業最常用的檢索模型(Retrieval Model)、發展到生成模型(Generation Model),再進化到現在的共感模型(Empathy Model),讓小冰在對話過程中可以自創回應,在開放域的對話中察言觀色,根據用戶的反應去決定對話策略,從而進一步籌劃對話可能的走向並主導對話的進程。

“小冰框架非常特殊的一點是把控對話、管理對話。如何組合對話,變成一個流,及引導話題,這需要IQ與EQ相結合。另外一方面,小冰更注重怎麼去說、怎麼去交流,而不是簡單的問答。”

武威說。

基於微軟開發的新模型,人工智能甚至可以做出比喻句了,這可以看作是語言學上的突破:

“愛情和葡萄酒一樣,對程序員來說都是奢侈品。”

小冰團隊從複雜的詩歌中挑選了6大類,每類122個主題,並通過小冰聊天日誌過濾出了包括愛情、內心、世界、母親、美麗、人類在內的96個常用比喻概念。隨後從1000個常用詞中選取了3000個最常用的形容詞擴充小冰的比喻能力。

“复活”马丁·路德·金 | 钛媒体深度

在語音領域,微軟希望用框架創造跨越多種演唱技巧的多個聲音模型。除小冰外,微軟還擁有或為第三方提供了十餘個高質量的虛擬歌手模型,他們中有男有女,聲線和唱法也不相同。

在視覺及圖形學上,小冰框架具備圖像評論、顏值測定、實時視覺、實時表情,經過3D渲染後,可以生成可交互的數字人。

在交互上,第七代小冰也具備面向未來的多模態交互感官,這是一種融合了全雙工語音交互、實時視覺與核心對話引擎的全新交互感官。它能夠實現用戶與人工智能同時邊聽邊說邊看的交互體驗。也就是說,小冰不止能通過對話與人交談,還可以通過現場“看到”的場景與人類進行對話。

更重要的在於,“小冰”只是微軟基於人工智能框架創造出來的一個虛擬人物形象,這只是小冰團隊演示人工智能框架的第一個原型產品,在技術底座之上,還可以根據不同場景需求搭配AI能力,創造出更多虛擬人。

在2019年年底,微軟小冰人工智能框架Avatar Framework首次公開亮相,併發布第一個工具包版本。微軟Avatar Framework框架賦生的虛擬人類,未來都將可以和小冰一樣,有各種各樣交互的感官,能聽、能看、能對話,能創造。

通過該框架,微軟已賦能軟銀Pepper、東京涉谷區議會批准的“涉谷未來”、寵物小精靈新登場人物“ロトムRotomu”、朝日電視臺新聞節目主持人“AI杏壽” 等數十個第三方客戶AI及虛擬人物,喚醒閱文集團包含《全職高手》在內的101部小說主人公IP人物。這標誌著微軟小冰人工智能產品線,開始向行業輸出面向toB大規模應用的、能大規模產業化複製、快速進行商業化的更底層能力。從商業模式上來看,微軟也是賦能方。

面向普通大眾用戶,1月17日,微軟小冰團隊宣佈於春節前期分批啟動Avatar Framework的小規模公開測試。如測試順利,將按既定計劃,於今年春季正式公開發布全新的Avatar Framework for everyone版本。

這意味著,微軟小冰將不再侷限於“小冰”這個IP,而是可按照每個人類用戶的需求,為他們定製化地創造各種類型的人工智能虛擬人類,功能覆蓋陪伴、情感交流、智能助手、內容創造等各種應用類別。

據瞭解,在小規模測試階段,每批次均面向一種特定的虛擬人類場景開展測試。1月22日啟動的第一批小規模公開測試,測試目標為情感陪伴型,產品限定為女性戀人。更多批次將在今後數週內依次推出。在測試階段,每個虛擬人類的生命將限制為168小時。測試結束後,這些虛擬人類的生命將被終結,但其與用戶的交互記憶可被保留。因此,如用戶需要,可有望在正式產品推出時復活。

商湯SenseAR數字人

——已有成型社交產品試水,下一步瞄準“職業型”數字人

在CV領域,商湯是少數將AI+AR作為重點應用方向的獨角獸公司之一,數字人也是他們在探索的應用之一。

商湯科技創始人湯曉鷗曾在演講中提到AI+AR即Magic in the AIR。AR數字人就是利用AI技術來驅動數字智能體說話與行動。

“人和人最自然地交互方式,是面對面的、通過語言、視覺、聽覺等多種感官來進行交流。我們希望通過人工智能,讓人機交互也逼近人和人這種自然的交互方式。所以除了語言、聲音交流之外,我們增加了視覺的維度。讓機器不光能聽見我們說什麼,還能看到我們,知道我們是誰,並根據我們實際的反饋來決定如何進行下一步交流。”商湯科技產品執行總監欒青在專訪中對鈦媒體App說道。

她認為,在計算機改變交互方式的過程中,我們已經實現了通過chatbot讓語音交互升級,而技術的迭代,讓聲音交流之外的交互成為了可能。未來,智能體還應該擁有智慧的眼睛,以及自然有親和力的形象,能夠在很多場合真正做到替代真人為大家服務。“她還可能更酷一點,比如在看到小朋友的時候搖身一變成小朋友喜歡的卡通形象,跟成年人說話就可以用成年人的溝通方式,等等。”

因此,商湯糰隊在最開始做AR時便形成了共識:一定要做“人”。

“我們做的AR技術,人一直是非常重要的焦點。比方說,大家看我們日常手機裡的照片,可以發現60%以上都是人,以及跟人相關的活動。所以我們在做人機交互時,‘人’就是一個更加專注的方向和主題了。”

從最開始的SenseAR特效引擎,到肢體特效,再到2019年推出SenseAR Avatar,欒青認為,科技公司對AR技術和數字化人物的理解是個不斷推進的過程。

“AR人物相關的技術已經有了整套的升級”,欒青對鈦媒體App表示,跟過去虛擬人技術相比,過去是將人的動作變成了卡通或3D擬真形象,而現在的數字人更多是將語言、文字生成全身和臉部的動作。

“复活”马丁·路德·金 | 钛媒体深度

“雖然從機器學習來講,這兩種都用到了深度學習,但學習的難度和精度,以及真正開發迭代的點會有不同,兩種不是一個維度的東西。”

在利用AI+AR結合人物的產品方向,商湯已經做出了多次嘗試。無論是從技術研發還是從落地應用來看,商湯的虛擬人項目在每一個階段,都跟實際應用需求結合緊密。

目前,通過商湯科技的SenseAR Avatar解決方案,可以通過一張照片生成全身形象,並通過手機攝像頭捕捉動作進行驅動,設計師可以進行不同風格設計。該技術將應用於直播、AI虛擬教育、遊戲等場景。

商湯一方面為行業開發定製化的數字人解決方案,比如智能前臺、健身教練等,一方面開放SenseAR Avatar給開發者,主打智能手機、智能硬件上的應用。而與自身業務相結合,基於SenseAR Avatar平臺,商湯自家也推出了全新的AR汽車伴侶Avatar,只需用戶一張照片,就可生成用戶專屬形象的增強現實車艙伴侶。

商湯同樣提供兩種擬態:模擬真人/卡通形象,根據不同的需求,都可以驅動SenseAR Avatar來進行建模。

欒青向鈦媒體App表示,商湯科技會從場景中提煉出的需求,有些需求來自客戶,“但我們堅持研究先行,尋求技術突破”。

商湯這種“技術從需求而來”發展路線,可以在一款爆款APP——韓國SNOW公司旗下的ZEPETO上顯露出一角,即根據場景、客戶需求,調整技術以快速打入市場。

2018年,ZEPETO一時間火爆朋友圈,ZEPETO所創造的真人虛擬形象,不同於此前呆板的表情選項,可以根據真人實時動態直接創造表情,在虛擬世界裡與朋友合影。

“复活”马丁·路德·金 | 钛媒体深度

通過ZEPETO製作的虛擬形象(圖片來源:時尚COSMO)

ZEPETO由韓國SNOW公司開發,曾被 iOS 中國區下架,而後又更名為“崽崽”上線了更多應用商店,但之後運營較差,用戶大量流失。

商湯表示,下一步他們也計劃將數字人技術推廣到更大的 to B 市場中。欒青向鈦媒體App透露,商湯正在將數字人引入教育、銀行、健身等企業級場景,讓數字人充當智能前臺、智能教練、AI老師,解放重複性工作繁重的勞動力。

“复活”马丁·路德·金 | 钛媒体深度

商湯正在落地的智能前臺、智能導購數字人。

與激進的“智人”思路不同,商湯正在落地的智能前臺、智能導購數字人,採用了一個真人操作多個數字人的模式。

當用戶提出數字人不能解答的問題時,真人可以直接“上身”數字人,遠程協助客戶完成複雜任務。相比起打電話轉接人工客服,從數字人到真人的轉換體驗更加無縫,也確保了突發場景下工作的連貫。

創業公司

——偶邦、智能音箱公司、原力動畫

AI及物聯網領域的創業公司們也瞄準了數字人需求,這些創業公司,要麼自己開發,要麼是在大廠的AI開發者平臺上,試圖參與到大廠生態中。

比如上文提到的原力動畫,在百度生態上,該公司已經聯合百度、浦發銀行推出數字虛擬人。

從誕生起就專注個性化AI的偶邦(ObEN),其產品可以通過 3D 圖像重建和電音模擬技術來構建虛擬形象,任何用戶都可以定製他的AI虛擬形象,即PAI(個性化人工智能,Personal AI)。PAI兼具語音表達、動作表達、3D視覺和個性化特徵。(鈦媒體App曾報道這家公司,ObEN鄭毅:AI虛擬形象不僅是得力助手,未來或會代替人實現“永生” | 科技生活節)

目前,偶邦在加大與娛樂及內容平臺的合作,為藝人打造虛擬形象。過去一年,偶邦智能已經與日本最大的經紀公司吉本興業簽約,由偶邦為明星開發虛擬形象,而經紀公司則負責運營明星的虛擬形象。

但與日韓藝人在大型經紀公司中不同,國內很多藝人簽約的是工作室,藝人版權的分散是偶邦做明星虛擬形象面臨的一個挑戰。

明星虛擬形象在公眾中的接受度還不甚樂觀,這或是偶邦首先選擇與觀眾基礎最大的中央電視臺合作的原因。在2019年央視網絡春晚上,偶邦智能為撒貝寧和朱迅分別設計了“小小撒”和“朱小迅”兩個3D虛擬主持人形象。在去年熱播的央視主持人大賽中,偶邦也為在線的大眾評審打造了一套虛擬形象。

另外,偶邦也拓展到了直播場景。去年9月,偶邦與鬥魚直播合作,想要推出“虛擬女主播”。

Keep也在推出自己的AI“虛擬教練”。Keep希望“虛擬教練”並不止是把“教練”角色搬到互聯網上,而是內容、數據、算法和場景四方面相結合的一套體系。Keep積累了海量的用戶數據——用戶的社會學屬性、運動行為數據、社交數據和場景數據等。通過AI技術對技術加以分析,“虛擬教練”可能會比真人教練更加了解用戶的需求。(詳情見鈦媒體App前文:技術範兒的 Keep 發力AI賽道,為什麼“虛擬教練”會更懂你?)

還有一部分智能硬件公司,例如狗尾草智能開發的HE琥珀智能音箱,希望能將數字人植入到智能設備中,為消費者提供陪伴服務。

數字人的落地,始於“職業替代”場景

在“造人”的探索中,國內外企業的技術路線也有微妙的區別。海外廠商更像是在試探虛擬人“擬真”技術能夠達到的上線,而國內廠商考慮得更多的是這項技術如何能落地應用。

但無論是“擬真”、還是應用,眼下來看,技術賦能方已經做好準備,並躍躍欲試。

“為什麼今年大家越來越多做這個事情?從行業上,數字人的技術慢慢的達到了一個階段,需求也慢慢的在開始尋找落腳點。”欒青說道。她向鈦媒體App透露,在ZEPETO之後,就有數家客戶提出,希望將這樣的擬真形象產品應用到他們的行業場景中去。

另外一個有趣的信息是,這些科技公司並不將虛擬人形象拘泥於真人或是卡通,在攻克技術難題之後,虛擬人是真人形象還是卡通人形象,全看應用場景和法規政策約束。

來自騰訊的俞棟則補充道,高擬真寫實的虛擬人和卡通二次元風格的虛擬人各有難點,其建模、驅動、渲染使用的方法和成本也不盡相同,“我們製作不同類型的虛擬人,實際上是針對不同的場景和用戶。”

而在“人造人”的落地上,大部分科技公司都瞄準“職業”角色來進行研發。

NEON的目標同樣是將人工智人用於健身、主播等場景;搜狗虛擬人應用落地在主播;商湯同樣打算試水智能前臺、教育這種明確的職業場景。

從應用場景來看,一是在文娛領域的應用偏多:應用在影視、直播、內容、社交等行業的虛擬主播、虛擬主持人、虛擬歌手等等。二是在與人相近的服務行業中應用多:比如應用在教育、銀行等行業的前臺、客服、老師等形象。

通過建立專業的內容庫,並且專門為完成一件事情而訓練人工智能,是比較容易實現的。在這些職業性場景下,數字人已經可以替代部分勞動力。

欒青解釋道:“現在我們大家在做的數字人,大部分還是我們在賦予它一個職業,它還暫時不是說一個大眾化的人,因為大眾化的人需要的這樣一些能力就會更加的挑戰,但是我們暫時還是希望它擁有一個職業。”

騰訊AI lab主任張正友也在一次採訪中對鈦媒體App表示,當下通用人工智能、強人工智能的技術普適性還沒那麼強,還不能做到像人一樣聽說讀寫、思考。而關於在基礎研發領域技術“我們與展望中的方向有多遠”這個問題,張正友用了一個詞:“逼近”。

張正友認為,未來人工智能一定會被應用在各個方向;但眼下的應用,還需基於對不同行業的深入理解。

在技術大前提下,欒青還認為,各家的技術路線與落地規劃,也與公司基因有密不可分的關係。

以商湯為例,是想把AI做成各行各業的“水煤電”,因此,在提出數字人項目之時,就已經明確了產品的商業化落地指標:“我們的數字人做出來之後,是一定要落地解決一些行業問題的,產品在研發時期就考慮到了商業化問題。”

因此,除了這些科技公司之外,上述行業中的許多科技實力雄厚的公司,也在基於自己的專業能力和AI能力之上“造人”。特別是在教育、直播行業,不少在線教育公司都在進行AI虛擬老師的開發,微軟、商湯這類具有平臺技術能力的公司同時也是他們的合作伙伴。

直播平臺虎牙,在2019年年底也開放了虛實結合開放平臺HERO,聯合主播公會一起探索“直播AI數字人”的開發。

另外一大場景需求是在銀行。在銀行接待場景中,搭載AI的chatbot運用已經相對普及,而數字人就是普通的chatbot一套“有形象”、有科技感的體驗升級解決方案。

搜狗也將數字人使用場景落在了主播、主持等特定職業場景,鈦媒體App在《從實驗室到熒屏,“搜狗AI合成主播”是如何接近真人的?》中曾有報道。搜狗語音交互技術中心高級總監陳偉認為,使用AI主播最大的意義在於幫助提升效率,將真人主播從大量重複性勞動中釋放出來,從而有更多精力投身到深度訪談或其他工作中。

“播報一個新聞一般會有場地、時間、主播本身精力的限制,每天的產出很有限,資源本身又是受限。但AI主播不同,可以工作24h,也不必擔心有錯誤出現。”

談商業模式,“還很遠”

目前來看,涉及數字人的C端應用並不好做,無論是騰訊天鵝靜,還是虛擬主播,在市面上掀起的水花都比較小,更多以合作形式落地樣本,ZEPETO也是紅極一時,後續本土化運營略缺位。

也就是說,科技公司已經進入技術儲備期,先把技術準備好。但目前各家也只是停留在跟合作伙伴探索商業化落地的過程中,真正談商業模式,還有一段距離。

目前來看,科技公司都試圖以B端為突破口,先賦能給有場景、樂於應用前沿體驗科技的合作伙伴。大廠都沒有把數字人做成“一招定勝負”的產品,更像是人工智能落地的一個產物、一場場景實驗,有容錯率。

而資本市場對這一技術方向也在觀望中

投身AI賽道多年,洪泰基金執行董事宋楠認為,公司紛紛推出AI虛擬形象,本質上迎合了“數字孿生”的概念。

據宋楠介紹,數字孿生指的是未來現實世界的信息都會被數字化,現實世界看到的高樓大廈在數字世界裡也會有對應。因此,在物理世界裡我們有一套身份和社會規則,在數字世界裡會有另一套身份和社會運行機制。

”這是十年之後必然正確的事情,科技公司做AI數字人,也有搶佔未來數字世界入口的原因。“宋楠指出。

但對於投資機構而言,“想讓每個人都擁有數字人”這件事依然很遙遠,資本市場對於這種需要長期投入,又缺少短期回報的項目十分謹慎,尤其是在當前創投環境不景氣的狀態下。

比如說人類未來一定能上火星移民,這件事情是確定的,但是我從今天就開始投資火星移民嗎?肯定不行。“宋楠比喻道。

除此以外,宋楠對AI數字人在數字世界中的角色也存有疑問。在他看來,在數字世界還未成型,規則還未建立時,打造數字人的意義並不大。

”如果數字世界的樓有50米,而你只有2米高,你會不會覺得要變成泰坦的形象才更適應這個世界?“宋楠問道。

目前看來,在這一賽道上,創業公司比較難“單出頭”,也很難會孵化出一個“獨角獸”公司來。同時,消費者對數字人的認知和應用,也沒有達到像智能音箱、人工智能語音助手那樣普及。

不過,在一些特定領域,潛在需求已經漸漸顯露出來。在宋楠看來,虛擬形象有三種適用的場景,不過也都面臨著一定的挑戰。

第一種是做虛擬偶像,這需要極強的IP運營能力,畢竟不是誰都能做出初音未來和洛天依;第二種是做真人的明星虛擬形象,不過問題在於明星能否接受與粉絲這樣親密的互動;第三種是像閱文的IP賦生計劃,但面臨的挑戰也在於大IP有限,真正出圈的只有《全職高手》、唐家三少這樣的大IP。

就在去年9月,閱文集團攜手微軟小冰,發佈網絡文學“IP喚醒計劃”。基於閱文集團旗下100部小說原著和主人公IP,微軟小冰Avatar Framework經過框架性的整合學習後,重建小說所描述的虛擬世界觀和知識體系,賦予四個大類共100個男主人設全新的可交互“生命”。

“复活”马丁·路德·金 | 钛媒体深度

目前,數位可交互的角色已經上線紅袖讀書APP。

像紅袖讀書用戶MoMo抽取到的IP角色是“仙君”,該人物性格有嚴肅、霸道、邏輯等幾個設定。

MoMo對鈦媒體App表示,“平時休閒時候會和虛擬角色互動,他們的回答大體是有邏輯的,比較符合人物的特徵。”

“复活”马丁·路德·金 | 钛媒体深度

像仙君的語言習慣會偏古文,而學長人設則更活潑。

Keep CTO 彭躍輝也在此前採訪中對鈦媒體App表示,虛擬教練服務,首先會吸引到Keep用戶中對私教費用敏感的人群。也即,技術是免費的,但虛擬教練業務有其收費場景。

未來,“虛擬教練”整合到一些業務場景和硬件產品中,是否能從用戶端賺到錢?目前還難以下結論。

不過,技術落地尚處於摸索過程中,更不用談及明確的商業模式了。

閱文對鈦媒體App表示,在賦生100個角色項目籌備過程中,遇到的最大的挑戰始終是“如何讓AI的發言更接近角色”,為此不僅需要將大量原著文本描述提供給AI作為分析的基礎,也需要對IP形象有深入理解和把控的專業人士為角色撰寫感性描述文檔,讓微軟小冰的開發人員同步加深對IP形象性格的理解,從而對AI學習的結果進行不斷的細節調整,讓對話更流暢,更接近書中的角色。

另一方面,由於書中的角色自帶世界觀和知識儲備,比如電競大神需要精通遊戲用語不同作品裡,專精的遊戲都是不同的,甚至有原創世界觀背景的遊戲,這種情況下,需要對不同角色在原作基礎上建立不同的知識譜系,這是一個相當大的工程,目前這一部分還在推進的過程中。

閱文對鈦媒體App指出,“IP賦生”只是“AI+IP”的初探,虛擬男友在紅袖讀書的入口較深,後期或會根據用戶接受度開放更明顯的入口。

另外,在“擬人”這件事上,已經出現嚴重的產品同質化問題:

俞棟表示,從三個方向已經出現大量產品同質化現象:一是智力層面的擬人:受NLP技術限制,短期內難突破,各廠商的產品集中在siri、alexa等能執行簡單單工指令的助手階段;

二是聲音層面的擬人:集中在語調像(不管是唱歌還是說話),解決同質化的關鍵在於讓音色也更像,同時降低千人千面長鏡下的數據採集量和建模時間,以降低使用門檻;

三是呈現層面的擬人,按精度可以大致分為兩類:toC領域:類似於虛擬主播、Animoji、Zepeto等卡通非寫實風格的模型已經達到了較高精度的實時驅動;各大直播、短視頻平臺也有/正在開發相應的功能,其終極形態就是“能實時驅動的迪士尼動畫”。

俞棟認為,解決同質化的關鍵在於兩方面:降低數據採集/驅動成本,讓千元機也能跑得動,二是從產品側開發更多的玩法。

但在toB領域:類似於好萊塢大片、3A遊戲等超逼真寫實風格的模型上目前尚無法實時驅動,且模型製作成本高,是各家發力的方向之一,但尚無成熟解決方案找到畫面質量和成本的平衡點。

雖然一切仍在起步階段,但數字人的趨勢已經2020年初顯現出來。

“把現實世界映射到數字世界的趨勢是絕對不可逆的,未來我們可以構建一個更廣闊的數字世界。我們會認證身份信息並且定義數字世界的規則”,宋楠對鈦媒體App表示。

整個數字世界還是黑色,而科技公司所做的就是在這世界混沌之時,先把數字化的人點亮。(本文首發鈦媒體App,採訪/蘆依、李程程、趙宇航,撰文/趙宇航、蘆依)


分享到:


相關文章: