端到端指代消解 Coreference Resolution
指代消解(CoreferenceResolution)是NLP里面一种常见的任务 , 可以识别一段文本中指代相同对象的部分 。 在2017年之前指代消解通常要利用语法解析和手动特征工程等技术 , 效果不理想 。 本文介绍第一篇使用神经网络进行端到端指代消解的论文《End-to-endNeuralCoreferenceResolution》 , 该方法超越了之前的所有指代消解方法 , 后续很多技术都用到了这一论文的思想 。
1.前言指代消解(CoreferenceResolution)是NLP里面一种常见的任务 , 主要用于识别一段文本中指示相同实体的内容 , 通常是名字和代词 。 下面是指代消解的一个例子 , 句子中一共有三个实体对象(我 , 姐姐 , 书) , 其中"姐姐"和"她"都是指代同一实体:
语法解析出现的错误会传递到下一个模型中 。 手工构造特征不够灵活 , 也很难用于不同的语言中 。《End-to-endNeuralCoreferenceResolution》是第一篇使用神经网络对指代消解进行端到端(End-to-end)处理的论文 , 其性能也超过了之前的模型 。 在介绍模型之前 , 首先看一下指代消解中的一些术语:
mention可以理解为文本中的实体antecedent指先行词 , 例如句子"我的姐姐把她的书给了我"中"姐姐"和"她"指代相同 , "姐姐"出现在"她"之前 , 因此"姐姐"是"她"的先行词 。 coreferent共指关系 , 例如上面的"姐姐"和"她"之间存在共指关系 。 cluster表示簇 , 一个簇里面的所有词指代同一个对象 。
模型的主要思想是把文本中所有区间(span)都考虑上 , 并计算两两区间指代同一对象的概率 。 例如句子"猫吃鱼"里面包含6个区间"猫"、"吃"、"鱼"、"猫吃"、"吃鱼"、"猫吃鱼" 。 假设句子的长度为T , 则区间总数N=(T+1)T/2 。
对于区间i , 它的起始位置用START(i)表示 , 结束位置用END(i)表示 。 区间按照START从小到大排序 , 如果START一样则按照END从小到大排序 。 区间i所有可能的先行词集合用Y(i)表示 , 如下面的公式所示 , 其中的ε表示区间i没有先行词 。
模型的结构主要分为两个部分 , 第一部分SpanRepresentations , 负责计算每一个区间(span)的表征向量;第二部分ScoringArchitecture , 负责计算该区间是一个实体的概率、两区间指代同一对象的概率 。
模型第一部分SpanRepresentations的结构图如下:
区间的长度不超过L计算区间是一个实体分数sm后 , 只保留λT个得分最高的区间 , T为文本长度每个区间只考虑K个可能的先行词3.实验结果作者和之前的指代消解算法进行了对比 , 结果如下 , 可以看到新方法的效果最好 。 ensemble是作者结合了5个用不同的初始化训练的模型 , single是单一模型 。
【端到端指代消解 Coreference Resolution】斯坦福公开课CS224N:CoreferenceResolution
推荐阅读
- 米歇尔·戴斯玛克特|海奥华预言的真相,地球人被带到九级文明,揭开神话背后的秘密
- 萝卜做饺子馅时,到底要不要焯水?很多人都不清楚,吃完告诉家人
- 显微镜|假如人类可以把显微镜提升到40亿倍,是不是全新的宇宙观?
- 火星|拍摄11064张照片后,火星毅力号看到了什么?这次还真看到了
- 冬天到了,教你几道暖胃家常菜,营养健康,孩子营养不发愁!
- 水煮鱼到底怎么做即简单还好吃呢?下面三款家常做法你觉得怎样?
- 孩子特爱吃的煎饼,颜色鲜艳,营养美味,2分钟出锅,看到就想吃
- 豆腐不要红烧了,教你做外脆里嫩的炸豆腐,家人吃到赞不绝口
- 成本3块钱的早餐饼,不放面粉,软糯香甜,老人孩子吃到回味无穷
- 不能再经典的小四卷,细节满满~
