05.23 史上最速度的机器收银员,1分钟不到狂点30多杯咖啡秒杀人类

文|AI财经社 周晶晶

编|赵艳秋

“五个巧克力、两个香草拿铁,算了,巧克力不要了。”鄢志杰以最快每秒5个字的语速向站在一旁的咖啡师点单,后者不得不选择中途放弃,“太快了,记不下来”。

鄢志杰又转向一台除了屏幕通体都是白色的机器点单师求助,后者在49秒内,记录下他点的30多杯咖啡, 对其点单过程中包括修改、删除、加单等要求进行了精准回应。人类咖啡师在听了鄢志杰第二次复述后完成了订单,用时2分37秒。

史上最速度的机器收银员,1分钟不到狂点30多杯咖啡秒杀人类

这是发生在5月23日云栖大会武汉峰会上的一幕。鄢志杰是阿里巴巴机器智能技术实验室语音交互首席科学家。

“我们将机器对人类口语的理解能力带到了新的高度”,鄢志杰表示。在过去,机器语音交互通常需要"语音唤醒+语音指令"两个环节,此次免唤醒的语音交互,打破了传统命令式交互方式。

升级后的语音交互方式突出的优势在于,在整个交流过程中,顾客不需要说”hi,点单机“之类呆板的唤醒词,可直接下单,更符合人与人的自然对话。这种更流畅的人机交互模式,被阿里称为“流式多意图口语理解引擎”。

体验升级的背后是技术的更迭。据鄢志杰介绍,这些模块并非简单级联,而是深度融合而形成了多模态语音交互方案,包括是公共场所强噪声环境下的信号处理和语音识别、视频识别与面部识别、场景感知等多模态融合的感知智能。

史上最速度的机器收银员,1分钟不到狂点30多杯咖啡秒杀人类

目前,该语音解决方案除了可替代收银员,还能在地铁卖票。目前,在上海地铁已实现落地。乘客直接说出目的地,售票机便可选择合适的站点和路线。测试数据显示,普通买票耗时往往超过30秒,而语音购票全程只需要10秒左右。

据介绍,目前已经落地的场景还包括车内语音助手、电话智能客服、可免遥控器操作的远场语音电视等。“未来我们希望实现公众空间里的万物皆能对话。”鄢志杰表达了愿景。


分享到:


相關文章: