Time:
Author: Yuxiao Dong, Nitesh V. Chawla, Anathram Swami
- homogeneous networks: representation of singular type of nodes and relationships, such as DeepWalk, LINE, and node2vec
- heterogeneous networks: representation of diverse node types and/or relationships between nodes
Abstract
- metapath2vec model
- 基于meta-path的随机游走形成node的heterogeneous neighborhood
- 再使用heterogeneous skip-gram model形成node embeddings
- metapath2vec++
- 使用heterogeneous negative sampling-based方法,在heterogeneous networks里使用了structural和sematic correlations,来预测一个节点的heterogeneous neighborhood
Introduction
- 和传统的meta-path-based methods相比,使用低维隐向量,可以很好的计算出没有meta-path连接的节点之间的相似度
- 目标:学习不同类型的节点的低维隐向量表示,使得保留heterogeneous network的结构和语义的概率最大化
- 优势:
- 在node classification和node clustering上都表现得很好
- 自动学习到不同类型节点的内在语义关系,
Problem Definition
虽然节点的类型都不一样,但是他们都被映射进相同的latent space中。
Framework
Heterogeneous Skip-Gram
并且使用negative sampling,从network中采样一小批节点来计算softmax。
hetererogeneous random walkers
概念:基于预先指定的元路径来进行随机游走,构造路径,从而能够保持“节点上下文”的概念。
- metapath2vec和metapath2vec++唯一的不同是skip-gram不同。在metapath2vec中,softmax值是在所有节点无论什么类型上进行归一化;而在metapath2vec++中,softmax值是在相同类型节点上进行归一化。
Reference
https://zhuanlan.zhihu.com/p/32598703