AI同传技术再曝大新闻!这次是百度……

被“AI同传造假”事件推上舆论风口浪尖的AI同传

,又出大新闻。

因“造假”和“圈地”事件连续两周上了热搜之后,今日,科大讯飞刘庆峰在科大讯飞1024开发者节上再谈“人机耦合”,称“现在机器翻译已经超过大学六级翻译水平,并且应用于日常沟通交流。但是在’信雅达’上,机器翻译距离高水平译者和同传还有很大差距”,耦合才是AI真落地。

AI同传技术再曝大新闻!这次是百度……

科大讯飞董事长 刘庆峰

无独有偶,今日有媒体曝出百度宣布AI同传最新重磅突破——一款名为STACL的同传AI,它可以实时将英语翻译成中文和德语。STACL不走“整句说完再翻译”的路线,能预测,低延时,演示效果惊人,引发MIT科技评论、IEEE Spectrum等一众外媒热议。据说,这是自2016年百度Deep Speech 2发布以来,又一项让技术外媒们如此激动的新进展。

Demo展示:翻译AI会预测

Demo可以看出,百度STACL的翻译延时非常短,往往延3个词到延5个词,而且具有预测功能。对于翻译AI来说,预测是一项很罕见的技能。不同语言的语序总有差异,所以,那些没有预测能力的翻译AI,通常需要等到人类讲完一句话,再开始翻译。

比如下图中汉语说到莫斯科,STACL根据前半句以及美国总统最可能与其他人发生怎样的活动,已脑补预测出“meet”。

AI同传技术再曝大新闻!这次是百度……

但是AI可能从前半句话里预测出会面顺利进行,而事实可能是会面并不顺利。这样翻译就容易出现失误。面对这样的情况,AI目前并没有纠错的能力,但用户可以根据需求随意调整

AI同传技术再曝大新闻!这次是百度……

据论文所述,这种预测能力是基于wait-k模型,可以根据历史信息,直接预测翻译中目标语言词汇

。该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可通过根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。比如,法语和西班牙语这种较为接近的语言,延迟可设置在比较低的水平;但是,对于英语和汉语这种差异较大的语言,以及英语和德语这种词序不同的语言,延迟应当设置为较高水平,以便于更好的应对差异。

百度wait-k模型不仅仅适用于RNN、Google Transformer两个翻译模型,还可以用在任何序列映射(sequence-to-sequence)模型上。也就是说,只要有模型能做到两种语言之间的翻译,加上wait-k,就可以实现同传。

详细技术细节请查看文末论文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency

外媒热议

由于本论文成果发布于硅谷,所以首先引发外媒报道评议。

IEEE Spectrum对百度AI同传新成果给予了高度评价,认为这个新系统揭示了一种通过预测而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美

AI同传技术再曝大新闻!这次是百度……

但在技术宅集聚的Hacker News和Reddit上,百度AI同传技术新突破的这条消息,并没有引发太多的讨论。

也有媒体将百度此次突破与谷歌、科大讯飞、腾讯对比,认为百度AI同传系统虽然仍有局限性,在外交、商务等一些重要场合,需要依靠人类同传高质量、专业的翻译完成,但在中国同传市场尚不完备的现状下,提供了新的选择。

看完论文,欢迎也写下你的观点。

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

AI同传技术再曝大新闻!这次是百度……

图片来源:论文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency,仅供学习,如涉及版权问题烦请联系删除。


分享到:


相關文章: