知识图谱表示学习
参考资料:
- https://www.cnblogs.com/sybil-hxl/p/12767516.html
- https://www.cnblogs.com/jtianwen2014/p/7018872.html
- https://zhuanlan.zhihu.com/p/103414766
知识图谱表示学习
- 保留结构信息的基础上强调关系和头尾关系;
- 强调的是节点和关系的表示,节点和关系同样重要;
- 往往指明了关系,比如水果和猕猴桃之间是所属关系。知识图谱表示学习中常常提到的一个概念就是三元组(头实体,关系,尾实体)
- 关系不再是单关系,而是多种关系,之前的方法不适用,出现了一些知识图谱表示学习的方法;
- 知识图谱的表示前提需要一个知识图谱,现在很多研究都用到了开源的知识图谱,也有不少人在自己搭建相关领域的知识图谱。知识图谱需要有实体和关系。
- 知识图谱表示算法:trans系列的算法,什么是TransE,TransR,TransH…它们都是将图谱表示成大量的三元组,通过三元组刻画实体和关系的向量表示。
知识图谱的推理方法
- 单步推理(直接关系,没有考虑路径特征)
- 多步推理(间接关系,考虑路径特征)
- 在单步推理和多步推理中主要包括4个研究方向:
* 基于传统的规则推理
* 基于分布式表示推理
* 基于神经网络的推理
* 基于上述方法的混合推理。
在每个研究方向又延伸了很多小的方向和方法,已存在的算法和论文比较多,具体可以参考如下的分类图(转自知乎@徐超):
关系推理方法
-
统计关系学习方法(SRL):如马尔科夫逻辑网络、贝叶斯网络,但这类方发需要设计相应的规则,因此没有很好的扩展性和泛化性;
-
嵌入式表示的方法:旨在将实体和关系映射为空间中的向量,通过空间中向量的运算来进行推理(如TransE),该方法取得了较好的准确率,但分布式表示的解释性不强,另外,较难实现并行计算;
-
基于关系路径特征的随机游走模型:该方法可以进行并行计算,具有较好的执行效率,但准确率与召回率相比嵌入式表示学习的方法存在劣势。
常见算法
论文、笔记、源码(陆续更新)
-
论文:ISGIR 2016,Hierarchical Random Walk Inference in Knowledge
思考:是否可以设计算法同时实现随机游走模型的执行效率以及保留嵌入式表示学习方法的准确率?
提出:在PRA基础上提出层次的随机游走算法HiRi进行实体关系推理 -
论文:IJCAI 2016,From One Point to A Manifold: Knowledge Graph Embedding For Precise Link Prediction
-
论文:AAAI 2016,Representation Learning of Knowledge Graphs with Entity Descriptions
-
论文:TransG : A Generative Model for Knowledge Graph Embedding
将知识图谱映射到低维稠密向量空间