语音画像:提升人工智能认知力的新入口

过去的互联网和移动互联网,在跟人的交互中,最重要的是你的手指。你需要输入文字,或者至少在触摸屏上点击几下。但是,不少科技公司都打赌,互联网下一个入口的关键是语音。这也是为什么智能音箱成为大公司和创业公司都纷纷涉足的领域。

不过,这还只是停留在把语音,也就是自然语言当做是发出指令和输入信息的手段。

《财富》杂志的一篇文章说,借助人工智能技术,其实可以从一个人的语音中识别出这个人的几乎全部信息,包括“情绪、社会地位、成长经历、年龄、种族、体重、身高、面部特征”。这项技术被称作“语音画像”。

语音画像:提升人工智能认知力的新入口

2017年12月,卡内基梅隆大学的研究人员就仅凭分析语音,还原出讲话者的面部三维影像。负责这项研究的科学家说:“你的声音就像是你的DNA或者指纹。”

这项技术也开始被投入实际应用。美国海岸警卫队就正在利用卡内基梅隆大学的技术,对恶作剧报警电话的人进行立案。海岸警卫队每年会接到150个左右这样的电话,它浪费了营救人员的时间和金钱。

把声音指纹投入到安全应用中,可以弥补银行目前人脸识别可能有的漏洞;也可以应用在汽车服务,开口说话,汽车就会识别出主人,解除防盗警报,根据你的喜好调节座椅、车内温度等。

同样的,所有那些把声音作为入口的智能硬件,比如电视、音箱等,都可以识别出人的年龄、喜好,而不是仅仅听从指令。比如,如果它识别出声音的主人还是个小孩,可以拒绝按照声音指令播放一些限制级电影。

技术研究机构未来今日研究所的创始人艾米·韦布的观点是:“如果DNA可以定义你本人,那么从你的声音中就可以捕获你的完整人格”。

总之,语音识别技术的进展让人们意识到,声音中包含的信息远比语言表达出来的多。

大数据处理信息服务商金盛网聚WJFabric认为,以数据研究的方式识别、认定自然声音并将其进行存储以便进一步研究,这是发展人工智能新的切入点。声音是人类能够主动释放出的,并且带有鲜明个性的物质,因此对于声音的研究完全可以成为了解人类的另一个维度。声音所传递的不光是可书写的内容,伴随声音一起体现出的语调、情绪等信息都能表征发声者的个性。因此,如果数据样本收集得足够多,那么在识别发声人,并对其状态定位、需求预判方面将有极大的研究价值。


分享到:


相關文章: