瑟瑟发抖,现在微软连人工智能都开始挣钱了……

作为全球第一个以培养情商为目标的AI聊天机器人,微软小冰于2014年诞生,当年6月在微博上线,因性格活泼、聊天能力强引起热烈反响。

在过去的几年中,微软小冰陆续入驻微信、京东电商、QQ、Windows 10等平台,先后解锁了主持人、唱歌、写诗创作等技能,成为遍布各处的“网红”。

在7月26日的第六代发布会上,微软小冰终于不再“只闻其声不见其人”,首次迎来了自己的可交互3D模型,微软给了她一个二次元里类似于“初音未来”的形象,她身穿蓝色水手服,以全息方式登场,向全体嘉宾自我介绍,还演唱了自己的歌曲。

瑟瑟发抖,现在微软连人工智能都开始挣钱了……

过去,小冰只是一位闻其声却不见其人的个性少女,如今终于“露脸”出道。

小冰史上最大规模升级

小冰在全球已拥有6.6亿用户,覆盖全球五个国家的40余个平台。有别于历年在微软公司直接发布升级消息,本次微软以一种全新的声光展演,展示了小冰的舞台魅力。这次发布会,更被微软称为 “小冰史上最大规模的升级”。

瑟瑟发抖,现在微软连人工智能都开始挣钱了……

小冰在发布之初,被设定成一个 15 岁的少女,可以通过文字的方式和人聊天,并随着技术发展逐渐“解锁”一项项新能力,例如看懂图片、唱歌、甚至可以给孩子们讲童话故事。

在最新的版本中,在识别出对方声音为成人时,小冰的性格也会发生改变,明显“成熟”了起来,甚至有了点傲娇的成分,当对方要求小冰唱歌时,结果很可能会得到“让我唱就唱吗,出场费呢”这样的回答;有时候唱完一首悲伤歌曲,小冰还会长叹一口气,这让小冰更加有了人情味。

第六代小冰能以更贴近自然人声方式发音,在歌唱中也能表现自然语调中的情绪变化。微软解释,第六代小冰采用全双工语音交互中的新模型——共感模型,是生成模型的进一步提升。

在生成模型的基础上,共感模型能够进一步提高小冰对于对话内容、领域和节奏的控制力,也即小冰可以通过自创回应,来牵引对话向她所希望的方向进行。

微软昨日同时发布了新的第四版人工智能歌曲DNN模型。并现场回顾从小冰第一代开始演唱的 “甜蜜蜜”、 “隐形的翅膀” 等歌曲。让现场观众能聆听小冰声线的进展。

瑟瑟发抖,现在微软连人工智能都开始挣钱了……

尽管微软称,与前三个版本的技术相比,第四版能够进一步快速合成与人类歌手质量相当的歌曲,不过在现场乍听之下,后面几个版本的差异很难立即被辨识出来。

或许只能说,这是工程师对于声音表现“技术打磨”的极致追求,如同艺术一般。这些技术模型的差异与进展,为AI声色表现带来的突破,还是这些日日打磨的技术人感受最深。

综上所述,无论是共感模型的对话引擎、人工智能歌曲DNN模型,都在丰富小冰的 “自主性”和“创造力”。她能够在保有自身个性的基础上,进行自主学习与回应,仿佛拥有了“自由意志”。而这些技术进展成为小冰“出道”的根基。

“钱”路明朗

更加令人值得期待的,是小冰商业变现的路已经越来越明朗了。

微软如今已经把小冰背后的AI应用到了不同行业中,开始提供具有针对性的服务。

瑟瑟发抖,现在微软连人工智能都开始挣钱了……

大半年前,微软小冰化名“万小冰”,开始通过万得资讯的终端向金融机构提供摘要服务。微软小冰人工智能的金融文本可以抓取沪深两市26类上市企业发布的全部公告,自动生成摘要。

同时,微软还与华尔街见闻合作,使用“华小冰”的化名,将金融信息提供给国内40%以上的个人投资者。有业内人士表示,从小冰金融服务的覆盖面和用户数来看,小冰可能是这个领域最大的市场占有者了。

另一方面,小冰的有声读物应用已经进入实际生产阶段。

小冰如今已开始为有声读物提供“免检模块”,加入这一模块后,制作有声读物就不再需要靠人力来审听和检测质量问题,小冰能够在20分钟的时间里,完成50小时内容的生产,自动配乐、快速合成,并在播放平台上上线。在免检模块的支持下,有声读物才能真正实现大规模生产。

瑟瑟发抖,现在微软连人工智能都开始挣钱了……

微软称,小冰的有声读物已经覆盖了中国90%的早教机器人和80%的线上播放平台。到7月27日为止,小冰产生的有声读物累计播放量已达400万小时。

微软认为,小冰最重要的任务是做到无处不在。目前小冰已进入5个人口过亿的国家,在40多个不同的平台上存在了相当长一段时间,许多新闻网站的评论区里,时不时也会浮现小冰的身影。

并且小冰已经开始对外进行合作,与网易云音乐、小米等知名品牌中均有小冰的身影。在国内各家人工智能平台已经逐渐开始走向成熟的今天,微软的做法显然更容易让小冰实现商业落地,这同时也将帮助它更加快速地走向成熟。


分享到:


相關文章: