人工智能|暗物智能CEO林倞:五层认知架构,重塑多模态人机互动产业化|CCF-GAIR 2020


人工智能|暗物智能CEO林倞:五层认知架构,重塑多模态人机互动产业化|CCF-GAIR 2020
本文插图

2020 年 8 月 7 日 , 第五届全球人工智能与机器人峰会(CCF-GAIR 2020)在深圳正式开幕 。
CCF-GAIR 2020 峰会由中国计算机学会(CCF)主办 , 雷锋网、香港中文大学(深圳)联合承办 , 鹏城实验室、深圳市人工智能与机器人研究院协办 。
作为中国最具影响力和前瞻性的前沿科技活动之一 , CCF-GAIR 大会已经度过了四次精彩而又辉煌的历程 。 在大会第二天的「视觉智能?城市物联」专场上 , 暗物智能联合创始人&ampCEO林倞博士 , 分享了暗物智能在人工智能前沿技术与产业化方面的思考与实践 。
林倞指出 , 目前很多成功的人工智能应用大部分还是依赖于大数据计算泛式 , 需要针对各种复杂的场景收集多样化的数据 , 使得其成本一直居高不下;另一方面 , 这些算法对噪声比较敏感 。 因此 , 林倞认为 , 即便对于被广泛研究和应用的感知层的智能 , 尤其是计算机视觉 , 目前系统还有很大的局限性 , 一是成本问题 , 二是稳定性、鲁棒性并没有达到或真正超越人的水平 。
其次 , 林倞认为 , 视觉跟语言的大部分理解是依靠想象和推测的 , 并不是依靠大数据的感知 , 因而AI系统自下而上的感知智能和自上而下的认知智能不可分割 , 必须统一在一个计算过程中 。

最后 , 大量实验表明 , 目前AI的智力水平不足12个月大的婴儿 , 无法推测他人意图 , 缺乏可解释性 。 这引出林倞的第三个观点 , 认知人工智能必须要理解人的意图 , 懂因果 , 可解释 。
基于这些情况 , 林倞介绍提出的五层认知架构 , 通过统一的人工智能操作系统和具有场景定义、任务描述能力的编程语言 , 实现高自然度人机交互 。 进一步的 , 林倞介绍该架构在教育行业的应用实践以及在游戏、金融等相关行业的拓展 。
以下是林倞现场演讲的全部内容 , 雷锋网作了不改变原意的编辑与整理:
林倞:非常感谢CCF-GAIR平台 , 我在2017年就作为嘉宾参加过论坛的分享 , 三年之后再来又见到很多老朋友 。 这次我主要从人工智能技术发展的角度来谈谈产业化的新机遇 , 特别是目前备受关注的认知推理技术;另一方面 , 我也着重介绍跨模态AI能力在产业中的实践落地 。
人工智能|暗物智能CEO林倞:五层认知架构,重塑多模态人机互动产业化|CCF-GAIR 2020
本文插图

图1. 人工智能发展现状

首先 , 现在的人工智能发展到什么阶段了呢?根据阿里巴巴达摩院2020年的科技趋势报告 , 人工智能在“听、说、看”等感知智能领域已经达到或超越了人类水准 , 但在需要外部知识、逻辑推理或者领域迁移等认知智能领域还处于初级阶段 。 对于这个趋势的判断我认为是对的 , 但是从技术及产业应用的角度来看 , 其实并没有这么乐观 。
人工智能|暗物智能CEO林倞:五层认知架构,重塑多模态人机互动产业化|CCF-GAIR 2020
本文插图

图2. 大数据-小任务的研究范式
以计算机视觉为例 , 目前大部分成功的AI/CV应用是依赖于大数据统计的研究范式 。 前沿的自监督/无监督以及神经网络搜索等算法 , 本质上还是依赖于大规模标注/未标注的数据 , 拟合数以亿计的参数 , 学习网络的结构以及其模型参数(参考于图2) 。 另外 , 为了使得学习得到的模型能够泛化到不同场景 , 需要为每一类物体 , 搜集大量的例子(涵盖各种形状、摄像头视角、材质、颜色、花纹、光照条件、遮挡等)并进行人工标注 , 每当遇到新样例或者新物体出现的时候 , 则一直重复这个过程 , 这也导致人工智能的应用成本居高不下 。 现有很多公司宣称在一些任务上指标达到惊人的99% , 或者说已经达到甚至超过人类 , 基本都是通过这种方式实现的 。


推荐阅读