基于图神经网络的知识图谱研究进展


知识图谱本身是一种图结构数据 , 采用图构建知识和数据之间的关联 , 应用图神经网络技术 , 有望结合知识和数据 , 实现更好的可解释和可信人工智能技术 。 本文将介绍基于图神经网络的知识图谱学习与计算以及基于图神经网络融合知识图谱信息的应用的研究进展 。
1 知识图谱与图神经网络
近几年来 , 人工智能技术得到了飞速发展 , 其进展突出体现在以知识图谱(Knowledge Graph)为代表的知识工程和以图神经网络(Graph Neural NetWorks, GNN)为代表的深度学习等相关领域 。 融合知识图谱与图神经网络已然成为研究人员进一步完善知识图谱学习与提升图神经网络模型推理能力的重要技术思路 。
知识图谱是以图的形式表现客观世界中的实体及其之间关系的知识库 , 实体可以是真实世界中的物体或抽象的概念 , 关系则表示了实体间的联系 。 因此 , 知识图谱能够以结构化的形式表示人类知识 , 通过知识表示和推理技术 , 可以给人工智能系统提供可处理的先验知识 , 让其具有与人类一样的解决复杂任务的能力[1~3] 。 如何更好地构建、表示、补全、应用知识图谱 , 已经成为认知和人工智能领域重要的研究方向之一 。
图神经网络的概念最早于2005年由戈里(Gori)等人[4]提出 , 是一种专门用于处理图结构数据的神经网络模型 。 使用图可以更准确和灵活地对现实应用中的数据建模 , 如在电子商务领域中的用户–产品交互图、化学领域的分子图、医药领域的药物副作用图等 。 因此 , 研究者们设计了多种图神经网络模型 , 包括图卷积网络(Graph Convolutional Network , GCN)[5~7]、图注意力网络(Graph Attention Network , GAT)[8]等 。 此外 , 由于异质图具有更灵活的建模和融合信息的能力[9] , 研究者们还尝试设计和应用基于异质图的图神经网络模型[10~12] 。 如何设计更合理的图神经网络模型 , 使信息沿着图结构更合理地传播 , 从而提升模型对图结构数据的拟合能力 , 是人工智能领域的一个热点问题 。
近年来 , 描述常识和事实的知识图谱成为了学术界和工业界广泛使用的知识表示方式 , 图神经网络在信息传播、关系归纳偏置上也展现了优秀的性能[13] 。 考虑到知识图谱本身恰好就是一种图结构数据 , 因此采用图构建知识和数据之间的关联 , 同时应用图神经网络技术 , 有望结合知识和数据实现更好的可解释和可信人工智能技术 。 一方面 , 利用图神经网络在学习节点、边表示上的优势 , 可以更好地学习知识图谱的实体、关系的嵌入表示 , 改善关系抽取等任务 , 帮助构建知识图谱 , 以及提高链接预测等任务 , 帮助补全知识图谱;另一方面 , 利用图神经网络在信息传播和推理上的优势 , 可以更有效地在应用任务中引入知识图谱中的信息 , 从而改善如文本挖掘、推荐系统、计算机视觉等领域中的应用效果 , 提供可解释的模型 。
本文将对知识图谱与图神经网络模型相融合的方法及应用进行综述 。
2 基于图神经网络的知识图谱学习与计算
由于知识图谱可以表征实体之间结构化的关系 , 如今已经成为认知和人工智能领域重要的研究方向 。 图神经网络利用深度神经网络对图数据中的拓扑结构信息和属性特征信息进行整合 , 进而提供更精细的节点或子结构的特征表示 , 并能很方便地以解耦或端到端的方式与下游任务结合 , 巧妙地满足了知识图谱对学习实体、关系的属性特征和结构特征的要求 。 本节主要从知识图谱中的5个典型任务介绍基于图神经网络的知识图谱学习方法 。
知识图谱表示学习
知识图谱表示学习 , 即为知识图谱中的实体和关系学习出一个低维度的向量表示 , 同时包含一些语义信息 , 从而得以在下游任务中更加方便地提取和利用知识图谱中的信息 , 例如链接预测[10]、常识问答[1]等 。 通过应用图神经网络 , 在学习知识图谱的表示时 , 每个实体都将利用到与其相关的其他实体中的信息 , 打破了彼此之间的孤立性 , 从而学得更完整更丰富的实体、关系表示 。


推荐阅读