谷歌又来搞“事情”啦!7月26日,第六代小冰正式发布了。这次又唱了一次《隐形的翅膀》,不过这次是模仿腾格尔的唱法,有意思!
机器人会唱歌?机器人竟然能学会人类的语气、唱法…还有自己的风格??我们先来感受下:
这还是我们认识的机器人吗?
小冰唱功的升级之路
2016年8月,微软推出第四代小冰,在9月份小冰18岁生日时,解锁了她的唱歌“天赋”,推出了日文单曲。通过对比视频可以看出,能明显听到此时小冰唱得还不是很专业,但已经很像是一个人在唱歌,很自然,不像是机器人了。
2017年,第五代小冰升级了声音模型,唱歌更好听了,同时发布了自己的单曲。
2018年,第六代小冰采用了全新的V4版本的DNN人工智能歌声合成技术,通过对歌手演唱声线和技巧的模仿,取得了质的突破。
机器人唱歌的原理
不同于虚拟歌手“初音未来”或“洛天依”通过录制好的声音库,再通过重新拼接声音库中的片段形成歌曲,小冰是根据输入的信号做出发声的反应的。
具体来说就是,在人工智能识别了曲子后,用“另一个模型”——用小冰的声音演唱出来。
完全按照简谱的节拍和音符来唱,会非常机械,不好听。谷歌的做法是通过模型来做,根据小冰的风格,调整曲子的细节。不断迭代模型、优化算法,在音质、自然度,包括衔接上做优化,并加入了换气声音,使得小冰唱歌的自然度大幅度上升。
小冰的声音是类似“娃娃音”的女声,这次对腾格尔的模仿,是在对腾格尔音质和演唱技巧的学习基础上与自己的嗓音特色进行结合,产生了一种属于小冰自己风格。模仿了人类的唱歌技巧,换气功能的加入,使得小冰能够产生长短强弱各不相同的呼吸的声音,呼吸声的前后,演唱部分也会随之发生相应变化。
不仅仅能唱歌 更是人工智能系统
微软创做小冰当然不是为了唱歌这么简单,她的定位是人工智能伴侣虚拟机器人,作为跨平台人工智能机器人,为不同的平台对接提供智能解决方案。与百合网、京东、东方航空、腾讯QQ、必应等展开了形式多样、丰富多彩的合作,开放微软(亚洲)互联网工程院的技术能力,输出语音对话助手。
六代小冰提出的共感对话引擎是一种可以基于模型进一步控制对等对话,当你在和小冰闲扯时,她一方面在回应你的问题,一方面也在悄悄的运用她的策略,来判断她是不是应当引导这个对话,然后观察、确证。
小冰现在已经是全球规模最大的对话式人工智能系统之一,目前拥有6.6亿人类用户,1.2亿月活跃用户,覆盖57种直接用户场景。
切入销售领域 Yeta引领电销新模式
如果说小冰的诞生是对于未来的高瞻远瞩,那么Yeta就是来直面电销领域现状、痛点的。招人难、离职率高、招到的人没能力混日子…究其原因,传统电销工作本就是一项单调、重复性大的工作,每天三四百通电话拒绝挂断是常态,面临的是低保障、高压力。
Yeta电销机器人的到来,为解决行业难题带来可行的解决方案。作为依托科大讯飞人工智能技术,采用的是科大研究院最新版DFCNN引擎,介绍产品解答客户并筛选出意向等级名单,它会严格按照指令工作,不会抱怨也不会离职。
通过Yeta改变电销模式后,降低企业对人力的依赖、减轻了用工成本,提高了拨打效率和业绩。用机器人来代替人做话务员将是今后电销发展的必然趋势。
閱讀更多 Yeta電話機器人 的文章