陈丹琦新作:关系抽取新SOTApipeline挫败joint( 三 )
下表 4 展示了这些变体的性能 , 从中可以看出不同的输入表示确实对关系抽取的准确率产生影响 。
本文插图
实体和关系如何交互
人们对 joint 模型的主要认知是 , 对两个子任务之间交互的建模对彼此有所帮助 。 但这项研究并未采取这种方式 , 而是使用了两个独立的编码器 。
研究人员首先研究了共享两个表示编码器能否提升性能 。 如下表 5 所示 , 简单地共享编码器对实体 F1 和关系 F1 分数均有所损害 。 研究人员认为 , 其原因在于两个任务具备不同的输入格式 , 需要不同的特征来预测实体类型和关系 , 因此使用单独的编码器可以学得更好的任务特定特征 。
本文插图
该研究的分析结果显示:
实体信息有助于预测关系 , 但实验未表明关系信息可以大幅提升实体性能 。
仅共享编码器对该研究提出的方法无益 。
如何缓解 pipeline 方式中的误差传播问题
pipeline 训练的一个主要缺陷是误差传播问题 。 使用 gold 实体(及其类型)进行关系模型训练 , 使用预测实体进行推断 , 可能会导致训练和测试之间存在差异 。
为此 , 研究人员首先探究在训练阶段使用预测实体(而非 gold 实体)能否缓解这一问题 。 该研究采用 10-way jackknifing 方法 , 结果发现这一策略竟然降低了最终的关系性能 。 研究人员假设其原因在于训练阶段引入了额外的噪声 。
在目前的 pipeline 方法中 , 如果在推断阶段 gold 实体没有被实体模型识别出来 , 则关系模型无法预测与该实体相关的任何关系 。 于是 , 研究人员考虑在训练和测试阶段 , 对关系模型使用更多 span 对 。 实验结果表明 , 这无法带来性能提升 。
这些常识未能显著提升性能 , 而该研究提出的简单 pipeline 方法却惊人的有效 。 研究者认为误差传播问题并非不存在或无法被解决 , 我们需要探索更好的解决方案 。
【陈丹琦新作:关系抽取新SOTApipeline挫败joint】此外 , 该研究使用的跨句语境对性能提升有所帮助 , 参见表 2 。
推荐阅读
- LOGO|卡普空新作《街头霸王6》Logo被扒来自素材网站:80美元即可拥有
- 游戏|系列35周年纪念新作正式公布!《街头霸王6》宣传PV官方首曝
- 天才|冬奥收获2金1银 谷爱凌谈天才与努力关系:99%以上都是努力
- 免疫力|科学家发现免疫系统与长相之间的关系:越健康的人越有吸引力
- 游戏|《仙剑》厂商恐怖新作《女鬼桥:开魂路》预告:学校遇鬼
- 游戏|《逃生》新作全新截图公布 场景氛围更加阴森诡异
- 比尔盖茨|被指22年前与员工有不正当关系 微软将公布比尔·盖茨性骚扰调查结果
- 科普|为什么吃完火锅总有一身味儿?原来跟它没关系
- 特斯拉|比亚迪4S店门前Model Y起火!特斯拉回应:与我们毫无关系
- 电池|碳酸锂缺货涨到天价!电池厂商托关系也拿不到货
