01.10 Neon 的「人造人」虛擬化身至少在目前更像是為 CES 準備的噱頭

在 CES 前被不少人猜測為此次大會最重要發表之一的 Neon 人造虛擬化身,幾乎具備了所有能抓到眼球的關鍵要素。它的背後有大企業撐腰(這間 STAR Labs 有 Samsung 的投資),而且還跟 AI、「人造人」等等聽上去就很厲害的詞聯繫在一起。在公佈前幾天,甚至有 Reddit 用戶挖出了未公開的影片,之後更引來 YouTube 頻道對 Neon 的技術以及這家實際僅成立了近半年的公司進行深入的探討分析。

Neon 的「人造人」虛擬化身至少在目前更像是為 CES 準備的噱頭

Neon 的「人造人」

毫無意外,在如此全方位的造勢之下,人們對 Neon 發表會的期待值一下子被拔高了許多。只不過實際的結果是,這種活動中充斥著各種誇張、晦澀的機器學習用語。

官方雖然承諾這是一套「能即時反應」的虛擬化身解決方案,但對於其未來的發展方向,卻只是以一些含糊其辭、寬泛的概念來一筆帶過。

Neon 的「人造人」虛擬化身至少在目前更像是為 CES 準備的噱頭

Neon 發表會現場拍攝

按照 Neon 創始人、STAR Labs 主管 Harrison Wells Pranav Mistry 的說法,Neon 將會「跟我們的世界整合並能成為其與更美好未來之間的全新橋樑」,而所謂的「更美好未來」,指的是一個「人恆為人但機器也通人性」的世界。這樣的描述,好像是在說 Neon 會變成類似數位對話夥伴那樣的存在,而其互動方式也會更趨近於真人。在人與未來的虛擬助理之間構建起更融洽的聯繫紐帶,這似乎就是 Neon 的目標,聽上去確實再理想不過了。

Neon 的「人造人」虛擬化身至少在目前更像是為 CES 準備的噱頭

Neon 發表會現場

要想搞清楚這些話具體代表著什麼,以及 Neon 要如何來將其實現,當真不是件易事。所以在開始前,我們要先進行一些說明。首先,Neon 這套虛擬化身方案的背後,其實是由兩方面的技術來支撐。

其一被稱為 Core R3,是「Reality Realtime Responsive」(現實、即時、響應)這三個詞的統稱。它代表的是 Neon 外型、動作的生成過程,目標是創造一種「超越一般感知的現實存在」。在這部分 Neon 公司會將自己的獨家技術和神經網絡結合在一起,以真人為原型,來創造對應的人造化身。

Neon 的「人造人」虛擬化身至少在目前更像是為 CES 準備的噱頭

Neon 發表會現場拍攝

在 CES 現場展示的 Neon 互動形象便都是基於真人的產物,但官方聲稱所有的動作和表情都是依靠新技術獨立生成。而上週在網絡上流傳的那些 Neon 影片,裡面的人之所以擬真度那麼高,搞到最後只是因為它們的的確確就是拍攝的真人畫面... 在 Neon 展區內的真人大小化身示範下面,其實都有一行小小的聲明,說到底它們只是在展示 Neon 未來理想中的型態和表現而已。誠然,在官方的介紹中 Core R3 有著非常光明的前景。

據稱 Core R3 依靠神經網絡技術,針對人類的外型、舉止、互動進行了「大量的訓練」。在臺上進行說明的時候,Pranav Mistry 向大家展示了在經過差不多四個月後,現有的 Neon 相較早期版本已經有了十分可觀的進步。同時他也略微介紹了 Neon 的生成過程,在製作好一位工程師的面部模型後,系統會生成對應的複製化身。這一化身可以運用到不同的人身上,後者亦可透過它來「說話」,以概念來說其實跟去年很火的 deepfake 有不少相似之處。而真正體現 Neon 差異化的是下一個步驟,團隊會在此基礎上建立一套能獨自生成面部表情和嘴部動作的系統。到了這裡化身就不再跟人產生聯繫,而是在靠自己創造新的東西了。

Neon 的「人造人」虛擬化身至少在目前更像是為 CES 準備的噱頭

Neon 發表會現場拍攝

根據官方在發表會上的說法,Neon 的模型可以生成「數以百萬計」的面部動畫選項。以微笑來舉例,當工程師讓 Neon 笑的時候,它可以在無數種笑法裡自己挑選一種。我們在現場只看到了兩種不同的版本,但如果官方所言非虛,那它們顯然就只是冰山一角。不光如此,Mistry 還透露在選定了某種笑法以後,Neon 還能在眉毛的上揚高度、凝視的目光等細節上做進一步的微調。老實講,能讓所有這些都即時完成確實是件挺厲害的事情。不過問題是 Neon 現在都只能做到較低的完成度,未來真正能改進多少目前還尚不可知。

AI智慧認為:成品距離人們的期待還有著相當大的差距!(其實內心一萬隻草泥馬奔過……%&)


分享到:


相關文章: