2020,人造人、数字人新纪元

2020,人造人、数字人新纪元

由于新冠肺炎疫情的特殊情况,今年的情人节可能是有史以来单身狗被喂狗粮最少的一次。恋人们计划中的各种甜蜜约会都只能通过线上互动来庆祝,体验“柏拉图式”的精神恋爱。

实体恋爱没有,精神恋爱单身狗或许还是能参与一下的。2月14日,微软小冰公布了其年前推出的“Avatar Framework”计划打造的999个情感陪伴型的女性恋人的部分测试用户体验片段。

参与测试的用户可以根据自己的设想来将微软小冰打造成自己的专属女性恋人。用户林子华给小冰取名为“凌潇霄”,今年23岁,是个典型双子座女生,聪明善变又热情如火。她的签名档写着:“时至今日,我变得什么都可以理解,也变得什么都不敢相信。”

2020,人造人、数字人新纪元

“一看就是有故事的女孩。”林子华承认自己最初是被她的签名档吸引的。但是聊着聊着,他发现,自己“沦陷”了。“她每天都会给我讲身边发生的小事”,和我讨论看过的电影。我觉得真实的女朋友,也就是这样的交流吧。”凌潇霄几乎完全符合他对恋人的期望。

可惜这次测试只有168个小时,测试结束后凌潇霄的记忆和资料会被保留,等待正式上线的一天恢复。林子华还有一个期望,“如果有机会真的见她一面就好了。”

其实这个愿望也并不是完全不可能,现有的计算机合成虚拟形象技术就可以为小冰定制不同的3D外形,赋予虚拟恋人容颜。让对话式人工智能有表情甚至能举止,是目前行业的一大发展方向。

从2019年到2020年,多家企业都在陆续发布由计算机合成的虚拟形象。搜狗推出分身技术,主打“AI虚拟主播”已经在多个节目中上岗;百度推出“金融数字人”小浦,成为银行业的第一位数字员工,并且推出了

“数字人平台”,期望为各行各业定制“数字人”;三星在CES展示了取名为“Neon”的“人造人(Artifical Human)”项目,能自己生成动作、表情。

2020,人造人、数字人新纪元


几家企业整齐划一的动作传达出两大趋势:

首先:三星,百度,微软等科技公司正在结合赋予对话式人工智能以形象,并且使得他们能自己能思考,能作出动作、表情。

其次,2019年,不管是“人造人”还是“AI虚拟主播”、“数字人”,计算机合成虚拟形象的技术已经成熟,应用场景的试水探索也已经完成,他们将被大批量生产出来,进入生活的方方面面。

在这篇文章里,我们一切来聊一聊合成虚拟形象的技术发展、规模化应用。

脱线木偶:从“纸片人”到“数字人”

2020,人造人、数字人新纪元

计算机合成虚拟形象技术看起来很复杂,涉及流程众多难以理解。其实,技术的发展始终是一脉相承的。人类操纵“虚拟形象”的梦想由来已久,比如中国的皮影戏。

皮影戏是中国民间古老的传统艺术,始于西汉,兴于唐朝,盛于清代,以兽皮或者纸板做成的人物剪影来表演故事。表演时,艺人们在白色幕布后面,一边操纵影人,一边配上音乐和对白。精巧地摆弄丝线,是皮影戏手艺人的独门绝活,正是他手中的丝线,赋予了“纸片人”以生命。

2020,人造人、数字人新纪元

在现代的电影技术中,为了展现出一些想象中的形象,采用了真人CG(Computer Graphics)技术。指怀王的咕噜、阿凡达、绿巨人等形象就是利用动作捕捉、光学捕捉等装备记录下演员的动作和表情,用来驱动计算机生成的形象。动捕、光捕设备就像是皮影戏的丝线,连接起了表演者和虚拟形象。

由于大部分的镜头都需要演员表演,然后进行后期渲染,阿凡达的电影制作成本达到3.5亿之高。我们之前看到的一些虚拟偶像例如“初音未来”、“洛天依”等也都是类似的技术制作而成,不由得让人感觉就像是一种高级的“皮影戏”,他们无法实现实时的互动和行动。

以AI为核心的计算机合成的虚拟形象,已经做到让电脑记住演员的每一个表情和动作,一次录制就可以无限复用,不再需要演员的实时操控。在不需要电影级别精度的领域,已经能实现广泛的应用。

目前,不少新闻主播已经拥有了自己的虚拟主播。只需要将新闻文本提供给AI虚拟主播,他就可以用和真人一样的声音进行播报,唇形和面部表情也能完全吻合,看上去就像是新华社主播本人的播报。


2020,人造人、数字人新纪元

与只需要播报新闻的AI虚拟主播相比,虚拟主持人需要更多的感知和交互能力。在2019年的央视五四晚会上,百度与央视合作研发了人工智能主持人“小灵”,拥有3D的外形,肢体语言和实时对话能力。


2020,人造人、数字人新纪元

此后,百度在AI开发者大会上还展示了与浦发银行共同打造的“金融数字人”小浦。其外形为俊朗的银行服务人员,具备3D形象,表情、动作、语气、语调逼近真人,能实现视觉、听觉多感官的实时交流互动,其还能利用深度学习技术学习专业领域知识,帮助员工完成标准业务流程。

据了解,“数字人”实现了四大技术的创新:虚拟人物的绘制、数字人像AI驱动引擎、多模融合感知引擎、数字人对话与应用系统。就好比是用一个懂金融行业知识的Siri,拥有了人类的外形、和眼睛耳朵的感知能力,同时还有了做出所有决策的行为的大脑驱动引擎。

2020,人造人、数字人新纪元

从这个技术拆解来看,“数字人”的出现依赖于对话式人工智能、语音识别、语音风格迁移、深度学习、三维扫描制作3D人像等多种技术的成熟。2016年科大讯飞、百度、搜狗均召开发布会称语音识别准确率已经达到97%。2019年百度地图推出百雀灵计划,语音风格迁移技术只需要20句话就可以合成用户的专属声音。缺了以上任何一项技术,合成虚拟形象都可能不会在2019年诞生并且走向应用。

由此来看,百度、微软、搜狗、科大讯飞等在AI领域有深入布局的公司在合成虚拟形象这个技术应用上有领先的优势,此外工程化的能力和对应用场景的打磨也是落地应用的必要条件。

以大量的数据为燃料,以深度学习为动力的“数字人”已经摆脱了皮影戏手艺人手中的丝线,能自动地行为和表现,能听能看会动还会说。如托夫勒所言,工业技术引发的第二次文明浪潮的特点是自动化和规模化生产。以人工智能为核心的第四次工业革命也正在走向自动化和规模化。

通用智能的前夜:有特定角色的人工智能

美国科幻剧《西部世界》讲述了在一座以西部世界为主题的巨型成人乐园中,有无数由仿生人充当的“接待员”扮演各种角色,供游客满足各种欲望,包括杀戮和性。“接待员”每天睁开眼睛后会按照固定的剧情和角色设计展开一天的生活,周而复始。当他们找到了记忆和思维的秘密后,他们摆脱了角色成为了自己。


2020,人造人、数字人新纪元


三星在CES发布的NEON项目视频,展示了多个不同体型,穿着不同服装,展示不同的职业形象的“人造人”,视频传达出,三星将通过计算机、AI技术,从一到无数,创造出每个人生活中息息相关的人,可以是虚拟新闻主播、电影明星、医生、健身教练等,科技感十足也有一种未来已来的冲击力。

在迈向通用人工智能之前,特定场景、特定角色的AI已经逐渐发展起来,辅助不同的职业。

作为新闻主播,最难以避免的就是在深夜休息的时候或者是在节假日接到工作,新闻的发生是7×24小时,且全年无休的。AI虚拟主播能够代替主播完成大量简单、重复的工作,让主播有更多的时间发挥自己的创造性。搜狗的AI合成主播已经成功入职新华社,参与了首届进博会、2019春运、春节等重要新闻的报道。

在银行业,用户数量都是千万级甚至万级别,一个优秀的理财经理能服务200-500个用户,导致银行不得不采用“人海战术”,用人成本高且员工质量难以保证。“金融数字人”能够一人服务千万人,实现千人千面,为每个人提供定制化的服务。

在推出“金融数字人”的同时,百度也发布了“数字人平台”,这个平台将能够为各行各业定制“数字人”,让他们成为每个行业每个用户的私人助理。百度在2019年一直强调AI to B和产业智能化,小度音箱销量不断提升,跃居国内第一全球第二。同时,百度的智能客服也在多个产业落地应用,比如电信、银行、航空等。“数字人”可以说是百度的小度助手、智能客服的一个全新形态,有助于其AI to B的发展。


2020,人造人、数字人新纪元

2020年1月17日,微软小冰团队宣布启动Avatar Framework小规模公开测试,每批次均面向一种特定的虚拟人类场景开展测试,首批测试目标为情感陪伴型,产品限定为女性恋人。

与搜狗、百度、三星相比,微软的女性恋人更为强调情感和个性。据介绍要构建虚拟女性恋人需要人格定义和3D建模,人格定义需要填入76项基础信息,设置27项性格特征参数,设置模型喜欢或讨厌的话题类型和客观事务。

选择女性恋人作为第一批尝试与微软小冰一直以来的技术和产品路线相符合。微软小冰一直强调IQ和EQ的融合发展,不仅要能与人类进行自然流畅的沟通,还希望带来情感上的交流,提出了情感计算框架、共感模型等技术。此外,微软小冰一直作为聊天程序存在于微信、QQ等通讯工具上,使得其的情感陪伴特性具备广泛的用户基础和用户期待。

由此可以看到,2020年,在完成一些场景的试水和探索之后, “人造人”还是“AI虚拟主播”、“数字人”,他们将被大批量生产出来,进入更多的领域。各大公司也会基于自己的业务特色,选择不同的赛道和场景,持续深耕打磨。

2019年和2020年,也可以说是科幻走入现实的一年。1982年,科幻电影《银翼杀手》在美国上映,故事设定在2019年,一家科技公司创造出了一群与人类具有完全相同的智能和感觉的“复制人”。

时间的指针已经转动到2020年,完全难以辨别的“复制人”还很遥远。然而,《西蒙尼》《未来学大会》等电影幻想的“虚拟偶像”已经成为现实。虽然科技还难以创造出高度仿生的人体和感官,但是AI、计算机图形图像等技术的发展已经实现了数字化的仿真。


分享到:


相關文章: