混合人工智能系统是机器学习技术的终极进化体吗?


混合人工智能系统是机器学习技术的终极进化体吗?

From: Tech Talks; 作者:Iris


深度学习,作为近年来重燃起AI的全盛之火的创新性技术,能够帮助人们解决计算机视觉、自然语言处理和语音识别等方面的诸多关键问题。然而事实上,随着深度学习的成熟,有些人认为它有逐渐从高峰走向低谷的趋势。显然,要想让AI充分借助深度学习进一步发展,我们还有很长一段路要走。

在2019年的各大国际顶会上,许多缔造深度学习技术及人工神经网络的先驱们都承认了这一事实。Geoffrey Hinton、Yann LeCun和Yoshua Bengio这三位“深度学习之父”都曾谈到过神经网络的局限性。同时,混合人工智能的概念再次被搬上台面。那么,它会是智能系统发展的下一个全新阶段吗?


机器学习技术的前进之路在何方?

在NeurIPS 2019大会上,Bengio提出了第二代深度学习技术。这代表着全新一代的神经网络,可以处理无序分布数据和因果数据结构。在AAAI 2020年大会上,Hinton则讨论了卷积神经网络(CNN)的缺点以及其向胶囊网络方向发展的必要性。

但对于神经认知科学家加里•马库斯(Gary Marcus)来说,真正的解决方案在于开发出能将神经网络与符号人工智能结合起来的混合性模型。

混合人工智能系统是机器学习技术的终极进化体吗?

马库斯如是定义一个强大的AI:“虽然它不一定有超凡的功能,但用户相信它能发现可靠的、适用范围广的处理方法,以及各种综合性知识和人体所无法记忆或存储的数据。我们期望的并非一台机器,而是一个能够持续学习的,并且有着强大学习能力的‘成年人’。”

这些都是目前的深度学习系统所缺少的关键特性。深度神经网络可以获取大量的数据,并利用巨大的计算资源来解决一些小范围内的问题,如检测特定类型的对象或在特定条件下玩复杂的视频游戏。然而,它们不善于进一步拓展自己的技能。马库斯写道:“如果现实环境与它们所受训练的环境不同,我们则很难再百分百地相信它们了。”

举个例子:AI能在观察过数千张椅子的图片后,在现实中识别出椅子的模样,但如果在它的数据集里的图片都是千篇一律的,那么它很可能无法识别一张形状相同、但却被翻转过来的椅子。一个强大的AI在数万小时的《星际争霸2》游戏中经过训练后,可以在游戏锦标赛上战胜多个用户,但是,一旦改变了游戏中的地图或单位,它的表现就会一落千丈。它甚至不能玩任何类似《星际争霸2》的游戏——

它的学习能力非常单一

混合人工智能系统是机器学习技术的终极进化体吗?

AI助手在玩《星际争霸2》

目前解决AI泛化问题的方法是建立一个扩展模型:建造更大的神经网络,收集更大的数据集,使用更大的服务器集群,演化成更高强度的强化学习算法。

不过,事实上,这种“越大越好”的方法所能产生的结果是有限的,它同时也会引出其他一些尚未解决的问题。首先,开发和训练大型神经网络所需要的巨额成本,对多数科技公司来说就是天文数字。

当涉及到语言处理时,神经网络的局限性也变得更加明显。OpenAI的GPT-2和谷歌的Meena聊天机器人等语言模型都包含有超过10亿个参数(神经网络的基本单元),并且都经过了基于千兆字节文本数据的训练。但正如马库斯指出的那样,它们仍然会犯一些愚蠢的错误,集大成的数据库并不能保证AI在数据处理上的绝对准确性。而当计算能力被应用到开放性领域,例如对会话语言的理解和对现实事件的推理中去,那么,智能系统对信息的处理进程永远不会像计划的那样顺利发展。它们给出的结果总是过于单薄,因此并不可靠。


为什么我们需要把符号人工智能和神经网络结合起来?

基于纯神经网络结构的方法最终将带来强大的或更加通用的人工智能。毕竟,人类的大脑是由物理神经元组成的,而不是由物理和数字变量组成的。而要推动纯神经网络的构建,对于智能系统而言,符号的构成不可或缺。换句话说,混合人工智能系统是以将人类智能和机器智能进行深度融合为最终目标,通过相互连接通道,建立兼具人类智能体的环境感知、记忆、推理和学习能力以及机器智能体(也就是通称的机器符号系统)的信息整合、搜索和计算能力的新型智能系统

。它不仅仅是生物与机械的融合体,更是同时融合生物、电子和信息等多领域元素的整体,实现系统在行为、感知和认知等方面的能力增益。

如今,已经有证据证明符号系统是有效的。它无处不在。我们的web浏览器、操作系统、应用程序、游戏等都是基于规则的程序。“近乎讽刺的是,世界上几乎所有的神经网络在其规范和执行上都遵循着相同的规则。”马库斯说。

数十年的计算机科学和认知科学已经证明,能够存储和操作抽象概念性的数据信息,是智能系统的必不可少的重要功能。这也就是为什么说符号操作是每一个强大的AI系统的重要组成部分。


混合人工智能系统的优势

混合人工智能系统的好处在于,它可以将神经网络和符号系统的优势结合起来。神经网络可以在我们从现实世界中收集的杂乱信息中发现规律,其所收集的数据信息视觉和音频数据、大量的非结构化文本、电子邮件、聊天记录等。基于同一规则的AI系统可以对提取的信息进行符号化操作。

由麻省理工学院和IBM的研究人员开发的神经符号概念学习器就是一个绝佳的例子。因其先进的神经网络,已能够解决机器视觉问题和解释性的问题。研究人员表明,学习器能够以极高的准确性来归纳分析VQA(视觉问答)数据集,并能利用较少的训练数据来产生有说服力的结果,这直接解决了限制深度学习技术发展的两个基本问题。

混合人工智能系统是机器学习技术的终极进化体吗?

神经-符号推理模型图示

过去几年具有里程碑意义的人工智能成就之一AlphaGo,也是符号象征性人工智能与深度学习相结合的典型例子。它依托于多层人工神经网络来进行自我训练,其中一层神经网络负责输入大量矩阵数字,通过非线性激活方法取出权重,再产生另一个数据集合作为输出。多层组织链接一起,以便于神经网络进行精准的数据处理。

混合人工智能系统是机器学习技术的终极进化体吗?

未来可期

值得称赞的是,马库斯坚持要将AI系统的全部现有的成就汇集在一起,以推动该领域的发展。在过去的几年里,他几乎是单枪匹马做到了这一点,尽管AI领域的大多数知名人士都对重新审视符号操纵的想法不屑一顾。

马库斯如此坚持自己的观点,他的坚决不禁让人回想起在神经网络颓靡的那几十年里,“深度学习之父”是如何继续推动神经网络向前发展的。他们对深度神经网络的坚定信念最终开花结果,引发了21世纪10年代初的深度学习革命,并在2019年成功赢得了图灵奖。

也许,终有一天,我们将会看到马库斯创造出强大的混合人工智能系统,并带领我们走向AI的下一纪元。


混合人工智能系统是机器学习技术的终极进化体吗?

关于我门

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。

将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。

将门创投基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在近四年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”: [email protected]

混合人工智能系统是机器学习技术的终极进化体吗?


分享到:


相關文章: