认识Meena, Google AI的最新聊天机器人技术

聞數起舞

2020-01-31 01:45:25

Photo by Jared Arango on Unsplash

几年前，当我看着Sundar Pichai推出Google Duplex时，感到不寒而栗。那个预订电话的人，真是可怕的美丽。嗯，真是神奇。

今天，我刚刚读到了Google AI的新聊天机器人Meena。它被描述为

多轮开放域聊天机器人，对从公共领域社交媒体对话中提取和过滤的数据进行了端到端的训练

让我们分解一下

多回合表示参与者之间来回对话。请记住，Lisa（Google Duplex）试图与真实的人预约理发的对话。该对话可归为多回合，因为该聊天机器人不会失去上下文，并且会保持有意义并能够完成任务。

开放域意味着您可以与聊天机器人讨论的主题没有任何限制。这个想法是使聊天机器人更像人类。像人类一样说话。有了足够大的数据集，聊天机器人应该可以做到。即使没有上下文，人们也可以找到一种明智地进行对话的方法。这就是聊天机器人的开放域。

一个可怕的笑话

这或多或少将是文明的终结，不是吗？大家都听过这个笑话吧？没有？在这里-世界上最杰出的科学家创造了第一台AGI计算机（或计算机网络）。他们问AGI的第一个问题是-有上帝吗？情报回应-现在，就在这里！

挖掘和过滤-对数据进行语言处理和过滤。挖掘和过滤的目的是，首先从文本（有意义的单词或权重更大的单词或定义上下文的单词）中提取有意义的数据，其次，从句子中过滤掉所有杂音和所有不必要的垃圾。数据挖掘（和过滤）本身就是一个非常广泛的研究领域，其中涉及语言学，语言理论，形式语法等。

Google AI的博客文章说到：

训练的目标是最大程度地减少困惑，即预测下一个标记（在这种情况下，是会话中的下一个单词）的不确定性。它的核心是Evolved Transformer seq2seq体系结构，这是一种通过进化神经体系结构搜索发现以改善困惑性的Transformer体系结构。

对于统计学家，机器学习工程师和数据科学家来说，这些话可能很容易理解。但不是所有人。宽松地评估语言模型意味着检查模型的准确性。有很多方法可以评估语言模型。

评估告诉我们语言模型的优点

广义上讲，有两种类型的语言评估模型

· 外在评估模型-发生的情况是，您将两个竞争的语言模型通过相同的测试/任务（例如机器翻译，语音识别，语法校正等）进行测试。然后，您评估哪一个性能更好。缺点是评估这些模型需要大量时间和资源。因此，替代方案如下。

· 内部评估模型-内部评估模型的作用是基于语言模型的外部评估，即使用模型完成某些任务，将模型应用于特定用例或应用程序。内在模型针对语言模型的本质。固有模型中用作度量标准的一件事是困惑。一个例子是香农游戏（Shannon Game），它只是问一个问题：语言问题如何预测给定句子中的下一个单词？还有其他方法可以评估固有属性模型。

因此，困惑perplexity只是一个统计模型，它将使用内在属性来评估语言模型。

简单来说，整个想法是猜测给定不完整句子中的下一个单词，并查看模型对其预测的效果如何。那就是困惑perplexity背后的想法。困惑度越低，模型越好。

其他用于Google Meena评估的内容

在Google AI的博客上阅读这篇深入的文章，他们声称Meena的敏感度和特异度平均值（SSA）仅比人类低7％。

您还记得乔姆斯基的著名句子吗？

Colourless green ideas sleep furiously 无色的绿色疯狂地想睡觉

他试图显示一种语言的漏洞，以及一种语言如何具有语法和语义。语法是语法。语义就是意义。语法并不难。语义是。使用乔姆斯基的方法，一台机器可以在语法上讲出正确无误的句子。它今天可以做到。它做得不好的是-有道理。这就是整个努力的全部内容。

SSA针对语义-聊天机器人的响应有多有意义？以及对正在发生的对话的具体程度。因此，明智（或有意义）和专一（对话的背景）在纸上构成了衡量语言模型的良好性的良好指标。

本质上，敏感度和特异性平均值（SSA）是Google创建的指标，用于衡量对话型聊天机器人以明智和特定的方式响应对话的能力。就像人类一样。为了测试Meena，它与市场上其他流行的开源聊天机器人进行了对话。 Google AI的博客说，

为了计算SSA，我们与正在测试的聊天机器人（Meena和其他知名的开放域聊天机器人，尤其是Mitsuku，Cleverbot，XiaoIce和DialoGPT）进行众包自由形式的对话。

A conversation with Google Meena.

谷歌声称Meena优于当今市场上最好的生成模型，该模型由Elon Musk和Sam Altman创建，并支持OpenAI。这是其中的一些结果-

OpenAI's GPT-2 performance metrics on several datasets. Taken from OpenAI's website. Read this for d

关于SSA指标的更多信息尚待了解。但是，当他们说自己做得更好时，也许可以信任Google。他们以前已经交付了惊人的东西。

Google在博客文章结尾说：

尽管我们只专注于这项工作的明智性和特殊性，但在后续工作中还应考虑其他属性，例如个性和事实性。此外，解决模型中的安全性和偏差是我们关注的重点领域，鉴于与此相关的挑战，我们目前尚未发布外部研究演示。但是，我们正在评估与外部化模型检查点相关的风险和收益，并且可能选择在未来几个月中使用它，以帮助推进该领域的研究。

我希望他们强调事实，应对安全和偏见。这是最重要的。

这对我们的未来意味着什么？

当这项技术成为我们日常工作的一部分时，我们甚至都不会注意到。这绝对是Google Researchers的一项伟大成就。而且，他们考虑在这些模型中解决安全性，事实性和偏见性甚至更好。这也是OpenAI的基础。尽管他们的想法是，一个人（Google）手中掌握着太多的权力，所以如果AGI在不久的将来成为现实，那么我们能够通过将最好的最好的AI代码。

很明显，我会把这个留给您-

(本文翻译自Kovid Rathee的文章《Meet Google Meena》，参考：https://towardsdatascience.com/meet-google-meena-11c26849e12a)

以 AI 对抗 AI：“守护者”杨勇和腾讯安平的进化

154 万 AI 开发者用数据告诉你，中国 AI 如何才能弯道超车？

让 AI 训练 AI：揭秘阿里、浙大的 AI 训练师助手

BAT 三位医疗 AI 大佬出山，复盘 AI 战疫往事

今晚开课丨BAT 三位医疗 AI 大佬出山，复盘 AI 战疫往事

ai，ai，ai

AI 大牛沈向洋就职清华演讲全录：人类对 AI 如何做决定一无所知

03.06 AI 大牛沈向洋就职清华演讲全录：人类对 AI 如何做决定一无所知

02.28 尘埃落定！AI 大牛贾佳亚离开腾讯优图，创立思谋科技，投身差异化 AI 创业

NVIDIA AI 助力初创公司通过 AI 设计和控制建筑物

AI 没能让人类失业，搞 AI 的人先失业了

飞天 AI 平台重磅发布！阿里拥抱 AI 这五年

AI 遇冷？斯坦福年度 AI 报告来揭秘

寻找 AI 落地之王：2019 AI 最佳成长榜正式启动！

李开复：AI 和互联网同样伟大，未来 AI 是工程师必备技能

AI Insight：放弃幻想，搞 AI 必须过数学关

海信全面 AI 电视，AI 体验全面升级

创新 AI 力量，云知声获智东西 2018 AI 年度生产力创新奖

思必驰发布低功耗 AI 芯片 AI 交互智能生态布局初显规模

思必驰发布始终在线、低功耗 AI 芯片，AI 交互智能生态布局初显规模

“AI+”时代｜以数据为核，AI 正重塑垂直行业

业界｜专访「AI 教父」吴恩达：AI 将改变所有人类工作，下次寒冬不会到来

让我们分解一下

其他用于Google Meena评估的内容

这对我们的未来意味着什么？

相關文章:

以 AI 对抗 AI：“守护者”杨勇和腾讯安平的进化

154 万 AI 开发者用数据告诉你，中国 AI 如何才能弯道超车？

让 AI 训练 AI：揭秘阿里、浙大的 AI 训练师助手

BAT 三位医疗 AI 大佬出山，复盘 AI 战疫往事

今晚开课丨BAT 三位医疗 AI 大佬出山，复盘 AI 战疫往事

ai，ai，ai

AI 大牛沈向洋就职清华演讲全录：人类对 AI 如何做决定一无所知

03.06 AI 大牛沈向洋就职清华演讲全录：人类对 AI 如何做决定一无所知

02.28 尘埃落定！AI 大牛贾佳亚离开腾讯优图，创立思谋科技，投身差异化 AI 创业

NVIDIA AI 助力初创公司通过 AI 设计和控制建筑物

AI 没能让人类失业，搞 AI 的人先失业了

飞天 AI 平台重磅发布！阿里拥抱 AI 这五年

AI 遇冷？斯坦福年度 AI 报告来揭秘

寻找 AI 落地之王：2019 AI 最佳成长榜正式启动！

李开复：AI 和互联网同样伟大，未来 AI 是工程师必备技能

AI Insight：放弃幻想，搞 AI 必须过数学关

海信全面 AI 电视，AI 体验全面升级

创新 AI 力量，云知声获智东西 2018 AI 年度生产力创新奖

思必驰发布低功耗 AI 芯片 AI 交互智能生态布局初显规模

思必驰发布始终在线、低功耗 AI 芯片，AI 交互智能生态布局初显规模

“AI+”时代｜以数据为核，AI 正重塑垂直行业

业界｜专访「AI 教父」吴恩达：AI 将改变所有人类工作，下次寒冬不会到来

他曾说要让机器人考上清华北大，如今陷入“AI”造假风波

亚马逊 AI 在简历筛选中歧视女性？AI 犯错不是第一次了

AI、石墨烯、超广角、超微距……，华为Mate 20即将来袭

坚守普惠 AI，看华为云如何让 AI 落地！

09.21 快手 AI 技术副总裁郑文：快手在内容生产&内容理解上用到的 AI 技术

09.18 从“AI+”到“+AI”，AI需发展必须有而非感觉好的产品

商汤科技汤晓鸥：不存在 AI 行业，只有 AI+ 行业｜2018年世界人工智能大会

做底层 AI 框架和做上层 AI 应用，哪个对自己的学术水平（或综合能力）促进更大？

AI 芯片、L4 量产车、智能小程序，All in AI 一年后的百度交出了怎样的成绩单？

李彦宏：百度为 AI 投入年营收的15%，推出首款无人驾驶大巴与全功能 AI 芯片

荣耀10 GT版本正式发布：荣耀10 GT版手机什么时候发售？

「Ai」资本追着“AI+教育”跑 很多人都慌了

VC笔记7：无人驾驶百度和小三的撕，景驰，pony.ai，roadstar.ai

AI 开发者高薪太诱人？请收下这份给国内开发者转型 AI 指南

菜鸟推平台级 AI 产品，华为携手科大讯飞，共同做强 AI 生态

「资讯」震撼！AI 终于来了！AI 要来南宁了！可，谁是AI？

AI 可翻译婴儿哭声；药房请来人工智能看病抓药｜一周 AI 新闻

发布首款物联网 AI 芯片雨燕，云知声做 AI 芯片的逻辑和优势是什么？

波士顿动力机器人会跑了；AI+无人机助力长城修复｜一周 AI 新闻

AI 破解梵蒂冈秘密档案；智能手表让手臂变触摸屏｜一周 AI 新闻

技术人创业者夏粉：用 AI 创造 AI

用设备和场景倒推 AI 技术进步，智能手机+IoT 是 AI 的无限生态

百度：不仅All in AI，实际 AI 早已 in All

小米太无耻了。

蹭热点！说说我理解的手机包装盒事件。

苹果公司正式发布iPhone SE二代手机

华为河图、麒麟芯片和鸿蒙OS三驾马车并行？华为生态建设布局深远

小米高管表示，四千毫安时 5G 手机，和三千多毫安时 4G 手机一样

5G画风变了：麒麟985落地首跑，荣耀坐上开往高端的「地铁」

旗舰手机标配Wifi 6 换Wifi 6路由器的时机到了吗？

2020年5G手机卖不动？继苹果砍单25%之后，华为小米纷纷跟砍？

干翻华为P40系列 荣耀30也玩中

程序员辞互联网工作，跨行传统上市公司，上班第1天就蒙了

苹果发布新款iPhoneSE，3299元起售

我很纠结：我究竟适不适合做亚马逊电商？看了这三条你就知道了

请仔细阅读，关于跨境电商你想知道的都在这儿

骗子手段太“精明”：商家赔了货物又赔款，亚马逊平台骗术大揭秘

做跨境电商这么多年，今天才知道给国外客户发文件原来这么简单

值得收藏！三类卖家三种选品方案，总有适合你的一个……

万万没想到！亚马逊平台上面卖床单竟营收一个亿！你还在等什么？

做店铺这么多年，今天才知道我的listing突然被封，竟是因为……

亚马逊小白看过来！请采纳这些：亚马逊选品和运营的小建议

亚马逊卖家如何爆单？跨境精细化运营攻略必看

不收保证金、入住费、年费，还免三个月佣金，我也想入驻这个平台

马云终于要辞职了，留下的话句句触动人心

等等，明年5G手机将迎来大降价

微信公开课PRO版2019正在进行时，往届各自都有什么黑科技

推出「信任分」升级「闪购」，美团本地生活这盘棋有多大？

5G我们超越了6G我们也将领先! 美国为什么会害怕失去5G领导地位呢

界读｜华为：帮助英国共渡疫情难关，无端批评令英国蒙受损失

为什么华为今天可以傲视群雄，在世界上立于不败之地？

血战「在线办公」，阿里、腾讯、字节、华为的底牌与大杀器

2020年最强拍照旗舰来了 华为P40系列多项业界首创 香！

今天聊一聊直播

「Ai」资本追着“AI+教育”跑很多人都慌了

干翻华为P40系列荣耀30也玩中

2020年最强拍照旗舰来了华为P40系列多项业界首创香！