人工智能|跨域三大洲的圆桌讨论:人工智能的未来挑战与突破

作者 | 蒋宝尚、青暮
编辑 | 丛 末
7月9日 , 世界人工智能大会开启了一场跨洲连线 , 参与连线的有六位嘉宾 , 他们就主题《人工智能的未来挑战与突破》进行了圆桌讨论 。
人工智能|跨域三大洲的圆桌讨论:人工智能的未来挑战与突破
本文图片

其中香港科技大学讲席教授杨强作为主持人 , 其他五位嘉宾分别来自亚洲、欧洲和大洋洲:第四范式创始人戴文渊;新南威尔士大学Toby Walsh;香港科技大学张潼教授;英国帝国理工学院数据科学研究所所长、英国皇家工程院院士郭毅可;札幌市立大学校长中岛秀之 。
在讨论环节中 , 各位嘉宾认可了人工智能现有的一些突破进展 , 也对人工智能当下的挑战进行了思辨 。
杨强教授表示 , AI举一反三的能力以及隐私保护是当下难点;戴文渊从企业的角度分析得出AI当下的挑战分别是 , 认知门槛、人才缺乏、企业部署AI的成本太大;中岛秀之表示 , AI原始数据的处理方面还存在不足;张潼说 , 人工智能在迁移学习和小数据上还有很长的路要走;郭毅可提到 , 如何在数据和知识之间做区分和连接是AI的基础挑战 。
1
人工智能目前的技术热点
杨强:今天要探讨三个话题:第一 , 人工智能目前的技术热点;第二 , 人工智能遇到的挑战;第三 , 对人工智能的未来进行展望 。
今天的几位嘉宾在业界和学界都有着长时间的从业经历 , 见证了人工智能和深度学习产生的深远的影响与重大突破 。 那么 , 该如何看待现在人工智能的技术突破呢?下面有请第四范式创始人戴文渊教授谈谈他的观点 。
戴文渊:大部分人工智能领域方面的突破和应用确实取得了积极的进展 , 例如在中国已经可以看到许多落地应用 。
我们最初进行的AI应用落地研究的大方向是尝试将人工智能、科技与互联网行业相互结合 。 探索是从搜索引擎领域开始 , 将人工智能和搜索引擎相互结合之后 , 搜索引擎的性能表现提高了8倍 。
七年前 , 我们开始将AI技术应用到金融等行业 , 做更好的营销、更好的销售预测以及反欺诈、反洗钱等业务应用 。 五年前 , 我们又将AI应用到零售行业和能源行业 。
所以 , 人工智能的应用突破在不断的涌现 , 或许在明年就会看到更多应用场景 , 我们也正在努力把人工智能技术应用到更多实际的场景中去 。
杨强:感谢戴文渊 , 请Toby Walsh教授谈一谈人工智能的技术突破 。
Toby Walsh:在我是一个小男孩的时候 , 就曾读到了关于人工智能方面的一些内容 , 它对于我来说很有意思 , 激动人心 。
人工智能对于人类的智能来说是有益的补充 , 在很多领域它可以帮助人类的智能 。 但是它跟人类的智能又有很大的不同 , 例如对数据进行一点噪音添加之后 , 一只猫就会被识别为公共汽车 。
另外一个局限性 , 就是微感受 。 人类的意识、潜意识的东西无法被机器所习得 , 虽然也有相关的研究领域 , 但是并不突出 。 当然 , 我对于现在人工智能方面的进展很有信心 , 但未来还任重而道远 。
杨强:感谢Toby Walsh教授 , 请张潼教授谈一谈 。
张潼:对于现在AI或者机器学习的突破 , 应用落地最好的方向就是:简单的任务 , 简单环境 , 有大数据支持 。 例如游戏领域 , 在打游戏的过程中可以收集到很多的数据 , 而且具有非常明确的结构化环境 , 在这种情况下AI很强 , 已经带来了巨大的突破 。
另外在一些类似的确定性高的环境中 , AI的表现也不错 。 例如语言的识别 , 在拥有某些具体数据集的情况下 , 机器可以比人类表现更好 。 所以如果用当前最先进的深度学习技术 , 结合具体的结构化环境和具体的任务 , 人工智能表现会非常优秀 。
在技术层面 , 最近几年 , AI已经开始学习“未标注”的数据 。 例如在自然语言处理方面的Bert技术 。
还有一个技术在理论方面也有了重大进展 , 例如神经网络的运行模式 , 这也是未来的研究重点 , 可以让我们了解如何训练神经网络 。
从工业化的角度看 , 技术发展前景明朗的领域都是和“终端”有关 , 包括硬件层面 , 模型层面 。 以终端为导向的机器学习 , 能够降低人工智能工具的门槛 。 例如在硬件方面:云计算、边缘计算、车载工具甚至其他的一些硬件设备等等 , 能够让AI变得更加“亲民” 。
杨强:感谢张潼教授 。 接下来让我们有请英国帝国理工学院郭毅可教授 。
郭毅可:人工智能在过去十年取得了比较巨大的进步 , 主要体现在两方面:第一是自动特征提取 , 第二是我们可以从很多压缩数据中进行学习 。
这两方面的进步促使人工智能能够“识别” , 从而也做出了一些非常出色的应用 , 例如AIphaGo 。 当然在线学习也是非常大的进步 , 例如AIphaGo在围棋上打败了人类 。
我们现在处于一个数据驱动的AI时代 , 所有人都觉得数据越多越能促进AI的发展 。 其实从人类自身角度看 , 人类不是一个以数据为驱动的体系 , 我们是通过不断的学习知识来丰富自己对世界的认知 。 所以 , 只有将机器自动化和知识结合起来才能创造更大的效能 , 当前已也经有相关研究把一些模型和知识结合起来 。
另外 , 我们非常重视的一点是人工智能要做正确的事情 , 但正确到底是什么意思呢?机器又如何能够识别哪些是正确的 , 哪些是不正确?当前的一些工作表示 , 在很多的虚拟环境当中 , 机器都能够做出正确的选择 。 但是在真实的世界当中 , 正确和不正确之间的边界是很模糊的 。
所以 , 这一代的人工智能在“识别”方面取得了进展 , 而“认识”属于下一代的AI领域 。
2
人工智能遇到的挑战
杨强:郭毅可提到了很好的问题 , 我们如何让人工智能领会错误和正确之间的区别呢?这也是当前人工智能的一个“短板” 。
关于“短板” , 我谈一下我自己的经验 , 人工智能在学习现有经验 , 然后适应不断变化的环境方面(举一反三的能力) , 其实进展并不顺利 。 也就是说机器现在还无法有效的从小数据当中或者从经验的例子当中进行举一反三推理 。
另外 , 还有在隐私方面 , 我们从第三方获取数据的时候往往会碰到困难 , 别人不想和我们分享数据 , 这也是对人工智能的一个挑战 。 毕竟 , 当前的人工智能训练还是需要大量的数据 。
现在我把问题抛给各位嘉宾 , 你认为人工智能的一个大的挑战是什么?先从戴文渊开始 。
人工智能|跨域三大洲的圆桌讨论:人工智能的未来挑战与突破
本文图片

戴文渊:第一个挑战是AI认知门槛 , 这是企业在AI应用中面临的普遍问题 。 我举一个例子 , 我昨天去拜访了一家餐饮巨头 , 他们想要把线下的业务放到线上 , 改变业务模式 。 传统上 , 他们进行线下业务管理 , 但是疫情后 , 他们发现只有5%的营收是来自于线下的 , 95%的营收是通过线上数字化渠道来的 。 此前他们的营销模式是让门店员工给线下客户派送消费券 , 再给客户做一些产品推荐和附加服务 , 需要花费很多的人力和物力 。 如果是通过线上化渠道 , 这样大的任务量 , 是不可能通过人工来完成的 。 所以 , 这是个非常适合AI的场景 , 可以通过AI让机器来完成线上化的营销、推荐等 , 不需要由人来做 。
但核心问题是 , 这些AI应用需要数据科学来构建 , 但传统企业没有足够的数据科学家 , 就没有办法解决这些问题 。 我们现在数据科学家数量远远不够 , 就算是MIT的数据科学家也不能解决所有企业的所有需求 。 所以 , 需要让普通开发者或者JAVA工程师 , 也能够开发AI应用 。 这也是为什么过去五年我们把很多的时间都花在了自动机器学习(AutoML)的研究上 。 因为它能够让普通开发者去学习构建足够好的AI应用 。 所以 , 现在的数据科学家太少了 , 我们必须要努力发展低门槛的AutoML技术 。
第二个挑战是即使我们有足够多的数据科学家 , 即使我们可以通过让普通人开发AI技术 , 如果缺乏高质量的数据 , AI也无法实现 。 这就需要我们通过迁移学习把数据中的知识从一个领域迁移另一个新领域 , 保证AI在新领域的应用及效果 。 过去我们一直努力发展迁移学习算法 , 有很多优秀的迁移学习算法 。 我们发现开发的迁移学习系统 , 虽然性能非常好 , 但有隐私的问题 。
AI基于数据得出的一些结论被应用是可以被大家接受的方式 , 前提是这些结论并没有记录个人具体的数据 。 最近几年我们在迁移学习隐私保护领域取得了比较大的突破 , 联邦学习在隐私保护的基础上赋能数据共享 , 能够把知识从一个领域迁移到另外一个领域 , 同时也不会导致隐私暴露 。
第三个挑战是成本的问题 , 顶尖的互联网公司 , 需要有很多服务器支撑AI业务 , 很少有公司能够承受这些成本 。 所以我们也必须研究如何降低服务器的成本费用 。 AI不仅是硬件系统 , 还有软件系统 , 是硬件和软件深度融合的体系 , 软件设计必须要基于硬件的特点 , 硬件设计也必须结合软件的需求 , 并且做进一步的优化 。
软硬件深度融合优化是一个降成本方向 。 以第四范式服务的某零售企业推荐场景为例 , 过去需要采用88台传统服务器才能支撑AI业务 , 采用软硬一体的方式后降为8台 , TCO(总拥有成本)降低了90% 。
人工智能|跨域三大洲的圆桌讨论:人工智能的未来挑战与突破
本文图片

中岛秀之:深度学习是一种非常新的技术, 但是在原始数据的处理方面还存在不足 。 如果你给模型错误的数据 , 模型就会做出错误的事情 。
此外 , 我们在逻辑推理的研究上已经有了很长的历史 。 我认为应该把数据处理和逻辑推理两者结合起来 , 有机发展 。
深度学习的应用非常广泛 , 但目前普遍适用性还不高 , 未来深度学习应该变得更加普通性、大众化一些 。
Toby Walsh:我认为存在四个挑战 。 第一点 , 是让机器理解语言 。 如果机器能够理解语言 , 在解决其它问题时就很简单 。
第二点 , 是常识问题 。 常识没有一定的规律 , 并且机器和人拥有不同的感官系统 , 所以不可能直接学习人类的常识 , 但这又是非常有必要的 。
第三点 , 是小数据学习 。 人类可以从个例当中进行学习 , 可以举一反三 , 能够抗拒环境的变化或者灵活地根据环境做出不同的反应 , 而机器目前做的还不够 。
第四点 , 是人工智能的情绪感知 。 人有情感的感受 , 而机器没有 。 如果机器想和人进行沟通 , 首先要理解人的语言 , 理解人的情绪 。
张潼:人工智能在具体的应用层面上表现非常不错 , 这是在拥有大数据的具体环境的前提下 。 目前在一般的任务上 , 人工智能的表现还很差 。
但是在解决一般的任务之前 , 人工智能在迁移学习、小数据学习、常识学习上还有很长的路要走 , 所以我非常同意Toby Walsh的观点 。
第一点 , 目前更加紧迫的挑战是迁移学习问题 。 人工智能解决了单一任务后 , 如果换到不同的环境中 , 表现就变得很差 , 人类则很少出现这种困难 。 这个挑战更多和领域适应或者迁移学习相关 。 未来10年人工智能应该关注这类更加具体的问题 。 如果能实现这一点 , 工业化的应用会变得更加简单 , 这对于更加普遍和更加安全的人工智能应用非常有意义 。
第二点 , 即如何从大数据学习转向到小数据学习 。 我们需要借助知识、特定的表征等方法 , 来解决小数据学习问题 。
第三点 , 即常识问题 。 我们希望能够将常识注入到人工智能系统分 , 让它在进行逻辑推理时变的更好 。 目前 , 人工智能其实并没有依托人类的常识 , 而是依托数据做出概率的推测 。
最后一点 , 即更加广泛协同的人工智能应用 。 我们需要让来自不同的组织机构在不同的终端设备之间取得协同 , 以达成合作 。 同时还要关注如何让人工智能做正确的事情 , 包括隐私问题、责任问题和公平性问题 。 这些是更加广泛意义上的社会问题 , 解决这些问题可以帮助我们把人工智能应用到社会场景当中 。
郭毅可:我同意刚才嘉宾们所谈到的所有挑战 , 但是我认为最基本的挑战是 , 在人工智能时代如何在数据和知识之间做区分和连接 。
这有点像一个物理学问题 。 在物理学中 , 我们会进行观察 , 然后根据观察数据得出一个模型 。 我们首先是基于常识来进行观察 , 得到一些小数据 , 然后再进行迁移 。 这个过程基于数据和知识之间的连接 , 涉及小数据学习、领域适应和迁移学习 。
以前我们更多关注模型 , 在观察之后得出一些逻辑推论 。 之后人们开始更多关注大数据 , 根据数据得到概率分布 。 两者都存在问题 , 所以从根本上来讲 , 我们需要将知识和数据能够完完全全的结合起来 。
3
人工智能的未来展望
杨强:最后一个问题是展望未来 。 请想象一下 , 人工智能在未来50年会是什么样子?或者跳出思维框架 , 会有哪些其它科学核心技术取得突破 , 进而促进人工智能的发展 , 比如脑机接口、5G技术、物联网、量子计算等等 。
中岛秀之:目前的人工智能比较局限于处理单一的任务 , 但未来它的功能会更加强大 , 需要人类和人工智能系统更多地进行交流和互动 。 所以我们需要判断整个人工智能系统的价值系统是什么 。 人工智能不会按照人类的方式去生活 , 所以不能和人类共享相同的价值系统 , 或者拥有相同的常识 。 我们需要理想的交流系统 , 向人工智能提供人类的价值系统 。
Toby Walsh:人工智能技术进一步成熟之后 , 人类可能会变得更加懒惰 。 历史上 , 每当一种新科技成熟之后 , 人类都会变得更懒 。 这带来的风险是:人类可能会不由自主地放弃以前不太愿意做的一些事情 。
郭毅可:我认为在未来10年或者15年 , 人工智能会取得比较长足的进步 , 尤其是基础理论方面 。
健康医疗领域将会取得巨大进展 。 现在大部分医疗行业都是靠大数据驱动 , 在未来医疗行业会变得非常个性化 。 现在我们的医疗成本非常高 , 但在15年之后 , 人工智能技术能够帮助我们改善医疗环境 。 我相信人工智能能够真真切切的在医疗行业帮助人类 。
戴文渊:我相信5G技术和物联网技术将会助力人工智能的发展 。 目前人工智能是从人类身上获取数据进行学习 , 但有了5G技术和物联网技术之后 , 我们可以获得更多的数据量 , 让人工智能进行更好的场景学习 。
张潼:我相信在未来几十年有几个重点发展方向 。 第一点 , 解决人工智能处理单一任务、单一场景的问题 , 人工智能变得更加大众化 , 鲁棒性更强 , 变得更加强劲、更加安全 ,
第二点 , 我们会更加关注知识 , 让人工智能够实现逻辑推理 。 但是这也带来了不确定性 , 因为我们不知道会发生什么 。
第三点 , 物联网技术、5G技术最终将会和人工智能技术一起 , 实现设备之间的沟通、学习、合作 , 并且以协同的方式发展 。
【人工智能|跨域三大洲的圆桌讨论:人工智能的未来挑战与突破】杨强:由于物联网技术、5G技术的发展 , 会有很多机构展开合作 , 但是会存在某些限制 。 例如隐私方面的限制或者出于商业的利益考虑 , 他们无法完全的把数据进行共享 , 但又不得不进行合作 。 这种既需要隐私保护又需要合作的技术是一个新的市场 , 联邦学习正好满足了“合作”和“隐私”的技术需要 。


    推荐阅读