本书为《科技之巅3100项全球突破性技术深度剖析》系列书摘之一。
- 新巴别塔
巴别塔:
《圣经·旧约·创世记》记载,当时的人类联合起来,兴建能通往天堂的高塔。为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。
新巴别塔:
随着深度学习算法运用到自然语言处理领域,基于序列到序列(Sequence to Sequence)的端对端神经网络机器翻译(Neural Machine Translation,NMT)大幅度提高了机器翻译的质量和水平,“耳朵里”的实时翻译成为了“重建巴别塔”的突破性技术。
- Google Pixel Buds
过去两年里,市面上有不少公司都推出了实时翻译耳塞,其中最受关注的就是Google。
2017年,Google推出了Pixel Buds,一副价值159美元的无线耳塞,得到了业内不少关注。PixelBuds能够实时翻译40种语言,但是上市后大部分用户对它的评价比较一般。
使用方式:
1、一个人佩戴耳塞、另一个人手持手机;
2、佩戴耳塞的人用自己的语言讲话(默认是英语);
3、Google翻译应用就会对所讲的话进行翻译,并在智能手机上大声播放;
4、手持手机的人回应后,回答被翻译,然后在耳塞中播放。
改进领域:
1、解决背景噪声问题:背景噪声会增加应用理解话语的难度,同时也会让应用很难判断说话人何时停顿、何时开始翻译。Pixel Buds有效解决了这些问题,因为佩戴人可以在说话的同时用手指点击和长按右边的耳塞。
2、不用来回传递手机:将交互分别放在智能手机和耳塞上,可以让双方都能控制麦克风,帮助讲话者保持眼神交流,因为这样就不用来回传递手机了。
主要问题:
1、软硬件要求多:要使用实时翻译,Pixel Buds、Pixel智能手机和手机上的Google翻译软件缺一不可。
2、非实时翻译:Pixel Buds的翻译并不能算得上实时,谷歌翻译软件每次只能翻译一段话,所以流畅持续的双语对话还不能实现。
3、Google翻译软件用户体验无明显改善:Pixel Buds事实上并没有对Google翻译软件的用户体验有显著的改善。
4、耳机佩戴不舒服。
来自德国慕尼黑的耳机品牌Bragi就推出了Dash Pro,支持iTranslate即时翻译功能。
Dash Pro这款耳机更像是高配的无线耳机加载了可选的iTranslate即时翻译功能,而iTranslate需要付费才能使用。
使用方式:
1、在只有一对Dash Pro时:
(1)iTranslate付费用户就可以将Dash Pro当作收音麦克风,并即时配合智能手机将句子(如普通话)翻译成40种不同国家的语言;
(2)将翻译结果由智能手机的喇叭输出;
(3)对方听完之后再对手机说话, iTranslate就会向耳机输出翻译的句子。
2、在拥有两对Dash Pro时:
如果双方都是iTranslate的用户,就可以完全实现即时无线的语音翻译。
改进领域:
比起Pixel Buds, Dash Pro在耳塞体验和翻译的实时感上都有了改进。
- Pilot
Waverly Labs是一家位于美国纽约的创业公司,最近推出了Pilot(先锋)。
与市面上可买到的其他翻译耳塞不一样,Waverly Labs的Pilot的一双耳塞并不是捆绑在一起的,事实上,它们是被交谈的双方共用的。
Pilot耳塞听到语言后会在双方用户的耳朵里播放出来,让实时的双语交谈变成可能。
以众筹起家的中国公司Timekettle最近也成功开发出了WT2实时翻译耳机,其使用方法和先锋耳机相似,2018年年中上市。
在中国,有许多公司积极投入这一技术的发展,科大讯飞、百度、搜狗可以说是这个领域的领先者。
除了提供智能语音、翻译等服务外,它们也将技术引入硬件,不过,相较于外国业者偏好以耳机作为切入点,中国企业则选择翻译机,如:
1、科大讯飞推出晓译翻译机,
3、搜狗的旅行翻译宝和速记翻译笔。
可以预见的是,通过人工智能实现的即时翻译将会是未来的重要应用。
————————————————
原书信息
书名:科技之巅3《麻省理工科技评论》100项全球突破性技术深度剖析
出版社:人民邮电出版社出版
时间:2019-07
閱讀更多 蕎麥讀書 的文章