01.10 Neon 的「人造人」虚拟化身至少在目前更像是为 CES 准备的噱头

在 CES 前被不少人猜测为此次大会最重要发表之一的 Neon 人造虚拟化身,几乎具备了所有能抓到眼球的关键要素。它的背后有大企业撑腰(这间 STAR Labs 有 Samsung 的投资),而且还跟 AI、「人造人」等等听上去就很厉害的词联系在一起。在公布前几天,甚至有 Reddit 用户挖出了未公开的影片,之后更引来 YouTube 频道对 Neon 的技术以及这家实际仅成立了近半年的公司进行深入的探讨分析。

Neon 的「人造人」虚拟化身至少在目前更像是为 CES 准备的噱头

Neon 的「人造人」

毫无意外,在如此全方位的造势之下,人们对 Neon 发表会的期待值一下子被拔高了许多。只不过实际的结果是,这种活动中充斥着各种夸张、晦涩的机器学习用语。

官方虽然承诺这是一套「能即时反应」的虚拟化身解决方案,但对于其未来的发展方向,却只是以一些含糊其辞、宽泛的概念来一笔带过。

Neon 的「人造人」虚拟化身至少在目前更像是为 CES 准备的噱头

Neon 发表会现场拍摄

按照 Neon 创始人、STAR Labs 主管 Harrison Wells Pranav Mistry 的说法,Neon 将会「跟我们的世界整合并能成为其与更美好未来之间的全新桥樑」,而所谓的「更美好未来」,指的是一个「人恒为人但机器也通人性」的世界。这样的描述,好像是在说 Neon 会变成类似数位对话伙伴那样的存在,而其互动方式也会更趋近于真人。在人与未来的虚拟助理之间构建起更融洽的联繫纽带,这似乎就是 Neon 的目标,听上去确实再理想不过了。

Neon 的「人造人」虚拟化身至少在目前更像是为 CES 准备的噱头

Neon 发表会现场

要想搞清楚这些话具体代表着什么,以及 Neon 要如何来将其实现,当真不是件易事。所以在开始前,我们要先进行一些说明。首先,Neon 这套虚拟化身方案的背后,其实是由两方面的技术来支撑。

其一被称为 Core R3,是「Reality Realtime Responsive」(现实、即时、响应)这三个词的统称。它代表的是 Neon 外型、动作的生成过程,目标是创造一种「超越一般感知的现实存在」。在这部分 Neon 公司会将自己的独家技术和神经网络结合在一起,以真人为原型,来创造对应的人造化身。

Neon 的「人造人」虚拟化身至少在目前更像是为 CES 准备的噱头

Neon 发表会现场拍摄

在 CES 现场展示的 Neon 互动形象便都是基于真人的产物,但官方声称所有的动作和表情都是依靠新技术独立生成。而上周在网络上流传的那些 Neon 影片,里面的人之所以拟真度那么高,搞到最后只是因为它们的的确确就是拍摄的真人画面... 在 Neon 展区内的真人大小化身示范下面,其实都有一行小小的声明,说到底它们只是在展示 Neon 未来理想中的型态和表现而已。诚然,在官方的介绍中 Core R3 有着非常光明的前景。

据称 Core R3 依靠神经网络技术,针对人类的外型、举止、互动进行了「大量的训练」。在台上进行说明的时候,Pranav Mistry 向大家展示了在经过差不多四个月后,现有的 Neon 相较早期版本已经有了十分可观的进步。同时他也略微介绍了 Neon 的生成过程,在製作好一位工程师的面部模型后,系统会生成对应的複製化身。这一化身可以运用到不同的人身上,后者亦可透过它来「说话」,以概念来说其实跟去年很火的 deepfake 有不少相似之处。而真正体现 Neon 差异化的是下一个步骤,团队会在此基础上建立一套能独自生成面部表情和嘴部动作的系统。到了这里化身就不再跟人产生联繫,而是在靠自己创造新的东西了。

Neon 的「人造人」虚拟化身至少在目前更像是为 CES 准备的噱头

Neon 发表会现场拍摄

根据官方在发表会上的说法,Neon 的模型可以生成「数以百万计」的面部动画选项。以微笑来举例,当工程师让 Neon 笑的时候,它可以在无数种笑法里自己挑选一种。我们在现场只看到了两种不同的版本,但如果官方所言非虚,那它们显然就只是冰山一角。不光如此,Mistry 还透露在选定了某种笑法以后,Neon 还能在眉毛的上扬高度、凝视的目光等细节上做进一步的微调。老实讲,能让所有这些都即时完成确实是件挺厉害的事情。不过问题是 Neon 现在都只能做到较低的完成度,未来真正能改进多少目前还尚不可知。

AI智慧认为:成品距离人们的期待还有着相当大的差距!(其实内心一万只草泥马奔过……%&)


分享到:


相關文章: