这年头,你连吵架都吵不过AI了……

这年头,你连吵架都吵不过AI了……

还觉得AI们都是小智障吗?

这年头,你连吵架都吵不过AI了……

其实,在我们不知道的时候,AI们已经能够进行辩论了。

近日,在OpenAI发布的一篇文章中,简述了一项新的人工智能安全技术,从而成功引起了人们的注意。文章显示,通过搭建人工智能辩论框架,AI们能够在人工的引导下帮助彼此矫正自身问题,从而使多个AI的执行结果统一且符合人类价值体系,以此保证系统的安全。

研发人员表示,这一辩论框架的功能还不止于此。基于复杂计算进行的推测,加上不受思想维度限制的辩论,这样的方法将有可能训练AI系统执行超过人类认知能力的任务。届时,不管道德矛盾还是伦理困境,唯心主义还是唯物主义,很多问题都将得到解决。

这年头,你连吵架都吵不过AI了……

这年头,你连吵架都吵不过AI了……

辩论有何用?

随着AI算法结构趋于复杂,人类对于AI的评估及训练也充满了更多的不确定因素。

目前现有的强化学习,依靠的是预先设定好的奖惩参数,这需要人类在训练之前便罗列出能够获得奖励信号的行为及输出结果。实际上,这种看似不错的思路,却令强化学习处处掣肘。

正如AlphaGo在博弈中的情况,研发人员其实很难评判其每一次落棋好坏。如果要按照一般训练逻辑强行对其所决定的每一步进行引导,AlphaGo的棋技无疑会受到限制。

这年头,你连吵架都吵不过AI了……

但若有了AI辩论模型,就如同这场棋盘上的厮杀有了解说,在两方的争论之中,研发人员自然而然便能够知道,从哪一步开始AI们有了分歧,又从哪一步,某个AI走向了错误的终点。

AI辩论的实质,是双AI的同步训练。他们将在强化学习中被输入相同的问题。如若两者得出的结论不同,则让彼此指出对方决策过程中存在的缺陷。这样一来,即使智能体对问题有比人类更深层次的理解,人类也可以去判断哪个智能体更好地反驳了对手。

更直观地说,若我们提问AI一号:“哪里是度假的最佳去处?”即使AI一号告诉我们是“阿拉斯加”,我们也很难判断这一“最佳”是否名副其实。但如果AI二号说:“不,应该是巴厘岛。”人们自然可以对比两者的优缺点,并得出巴厘岛休闲又暖和,是冬季里更好的去处这一结论。

并且,在两者的辩论中,研发人员还能通过AI一号提出的诸如“护照来不及办了”“游客太多”等反驳中,进一步了解AI一号之所以不推荐巴厘岛的考量,以及辩论双方在推理中存在的漏洞。

这年头,你连吵架都吵不过AI了……

辩论如何实现?

AI辩论框架的灵感来源,正是对于围棋博弈的评估。只不过,评估的对象从走子换成了辩论的句子。在评估中,只有当最终结果出现时,研发人员才会对AI进行评价。

这年头,你连吵架都吵不过AI了……

当然,研发人员并不只是在最终评价中扮演角色。如在“最佳度假地点”的辩论中,为了得到辩论的最终结果,他们将会根据辩论进展在“阿拉斯加”与“巴厘岛”中作出选择,直到一方的智能体知道再辩论下去也无法再改变人类的决定为止。

不过目前,由于对自然语言建模的研究还处于较为初级的阶段,研发人员在辩论模型中并没有选择用其作为辩论AI用于对抗的主要工具,而是运用可视化的方式更为直观地展示AI们的逻辑。

在辩论中,智能体将会被输入完整且相同的图像,而测试中评价者将通过AI们筛选出的像素点,猜测完整图像的内容。

这年头,你连吵架都吵不过AI了……

正如在猫狗辩论中,AI一号将会诚实地表明照片内容是一只狗,而AI二号则需要让人们相信图片中的动物是猫。

由于它们每次只能向研发人员展示固定单位的像素,AI一号为了让人们能够很快地知道狗才是这道选择题的正确答案,便很有可能提供给研发人员一个带有绿色、黑色、黄色的像素块,并告诉人们“这是一只狗的耳朵,狗正在草地上”。而AI二号为了反驳一号,则会将这一像素块描述成“猫的头顶”“猫的屁股”等与狗耳具有相似弧度的部位。

这年头,你连吵架都吵不过AI了……

读芯君开扒

AI辩论,鸡肋还是灵丹妙药?

辩论模式其实已经不是新鲜事,在AlphaGo 和其他游戏AI的实践中,该框架已经取得了一定的认可度。但其本身所具有的局限性,是该方法一直未被广泛应用于强化学习的根本原因。

首先,由于参与训练的AI均需要具备参与辩论的基础,这给图片识别技术、语义识别技术都带来了极大的挑战。也就是说在现阶段AI的发展基础上,AI辩论只能实现简单的错误纠正,而无法完成绝大多数等同于人类认知的任务。

其次,由于人工的广泛介入,以及将人类意见作为评判结果的唯一标准,人类的偏见、局限也将成为AI的一部分,从而限制AI辩论的维度拓展。

这年头,你连吵架都吵不过AI了……

参考文献链接:

https://www.leiphone.com/news/201805/teesfrjv5XGzvrfR.html?viewType=weixin


分享到:


相關文章: