|北语信息院院长荀恩东:语言智能的核心是语义理解丨CCF-GAIR 2020
本文插图
作者 | 青暮
编辑 | 丛末
2020 年8 月7日-8月9日 , 在中国深圳 , 由中国计算机学会(CCF)主办 , 香港中文大学(深圳)、雷锋网联合承办 , 鹏城实验室、深圳市人工智能与机器人研究院协办的第五届CCF-GAIR全球人工智能与机器人峰会 , 在深圳前海华侨城 JW 万豪酒店正式拉开帷幕 。
深圳市人工智能与机器人研究院执行院长、国际欧亚科学院院士、IEEE Fellow李世鹏担任专场主持人 。
第一位演讲的嘉宾是北京语言大学信息科学学院院长荀恩东教授 。 荀恩东教授的研究领域涉及汉语语义计算和语言资料建设 , 主持开发过国内外最大的在线语料库——BCC 语料库 , 并在多个领域开展过汉语语义理解落地应用工作 。 荀恩东教授的演讲主题是《语言智能核心问题——语义理解》 。
在演讲中 , 荀恩东教授表示 , 随着大数据红利褪去 , 语义理解已经成为自然语言处理中越来越重要的层面 , 并且不可避免 。
他首先讨论了自然语言的两个特点 , 即歧义和多样性 , 并指出这两个特点是语言理解的难点所在 。 然后他提到 , 语言理解的一般目标 , 是对自然语言进行结构化 。 最后 , 荀恩东教授介绍了一种新型的语义表示方案 , 即意合图 , 力求促进自然语言的语义理解 。
以下是演讲全文 , AI科技评论进行了不改变原意的整理:
本文插图
今天我分享的话题跟语言智能、语义理解相关 , 演讲主要内容是:语言智能及其应用类型;语言理解的目标、途径和方法;语义理解中的语义表示和构建 。
1 语言智能及其应用
本文插图
人工智能发展经历了几个阶段 , 计算智能、感知智能、认知智能和创造智能 。 我们在感知智能取得了非常大的进步 , 感知智能处理的对象是视觉和语音 。 认知智能处理的主要对象是自然语言 , 因为语言是认知的工具 。
本文插图
相比视觉和语音 , 认知智能或语言智能是更有挑战性 。 因为认知智能处理的对象是自然语言 , 自然语言非常灵活 。 在视觉和语音阶段解决的是识别问题 , 到语言阶段就涉及到理解问题 。
语言智能这么难是由自然语言的特点决定的 。 我们知道自然语言的歧义无处不在 , 歧义包括语义、词法、语法、语意、语用、语境等方面 。
举几个例子 , 比如说“鲁迅著作”在不同语境里有歧义:是指鲁迅写的文学作品 , 还是关于鲁迅的某种论述呢?“我们研究所有东西”属于分词歧义 , 也即语法歧义 。 “我在汽车上画画” , 在语法上没有歧义 , 但是在语义上有歧义 。 需要用一般常识告诉我们 , 人肯定不是在汽车顶上画画 , 应该是坐在汽车里画画 。 “有同事孩子考上名校很优秀” , “同事孩子考上名校很开心” , 对于谁开心、谁优秀 , 也属于语义上的歧义 。 “在冬天能穿多少穿多少 , 夏天能穿多少穿多少” 。 这两句的字面意思一样 , 结合语境就完全不一样了 。 这就是语言的歧义性 。
【|北语信息院院长荀恩东:语言智能的核心是语义理解丨CCF-GAIR 2020】
本文插图
语言的多样性也是造成语言处理困难的主要方面 , 包括主题不同、表达不规范等等 。 我们理解语言往往要调用外部的知识 , 比如世界知识 。 让计算机处理语言 , 面临着知识获取的瓶颈 , 以及文化习俗的密切影响 , 文化习俗是动态、约定俗成的 , 有时候甚至是不讲道理的 。
推荐阅读
- 马斯克|马斯克用活猪演示脑机接口技术:实时读取猪脑信息 心灵感应成真了
- 信息检索站资讯号|骁龙865再降400,8+128G至两千档,65W快充加持
- 新机发布|iPhone 12电池入网信息曝光,打败苹果的或许是苹果自己
- 行业互联网,5G|2020中国高速公路信息化展会焦点来了
- 中年|中国电科发起成立新一代信息基础设施生态联盟
- 行业互联网|德州市人民政府与山东数据交易公司、乾云信息科技集团战略合作签约
- 人工智能|从制造业信息化谈包装:包装“智造化”离我们还有多远
- 用户|专注碎片化信息聚合,一知app收获用户口碑好评
- 行业互联网|同盾&华为联合亮相中国高速公路信息化大会
- 行业互联网|拓维信息携手华为助力智慧高速发展加速转型