作者
蚂蚁金服
- Ziqi Liu
- Chaochao Chen
- Longfei Li
- Jun Zhou
- Xiaolong Li
- Le Song (佐治亚理工学院)
- Yuan Qi
摘要
本文提出了GeniePath,这是一种用于学习在排列不变的图数据上定义的神经网络的自适应接受域的可扩展的方法。在GeniePath中,我们提出了一个自适应路径层,该层由两个分别用于广度和深度探索的互补方法组成,其中前者学习了不同大小的邻域的重要性,而后者则提取并过滤汇总不同跳数的邻居的信号。我们的方法在直推式学习和归纳学习环境下均有效,与竞争方法进行的广泛实验表明,我们的方法能够在大规模图上产生最先进的结果。
Introduction
Essentially, the receptive field of one target node in graph domain is equivalent to the subgraph that consists of nodes along paths to the target node
提出问题:
Is there a specific path in the graph contributing mostly to the representation?
Is there an adaptive and automated way of choosing the receptive fields or paths of a graph convolutional network
传统方法:
频域:Laplacian matrix
空域:手工设计的感受野
为了解决这些挑战,本文提出了:
- 对于排列不变的图数据,我们制定了任何合格的聚集函数都满足的方法空间
- 提出了两个互补的自适应路径层组件,BFS(一跳邻居)、DFS(长距离、过滤噪音)
- 在几个数据集上进行的实验表明,我们的方法具有相当的竞争力,并且可以在大规模图上产生最先进的结果。另一个显著的结果是,我们的方法对传播层的深度不太敏感。
定义了 receptive paths.
GCN
- GCN
- GraphSAGE
- GAT
讨论
之前的主要工作是设计聚合器函数,但很少研究指导传播的有意义的路径
上图为账户和设备的图,红色为高风险账户,绿色则需结合节点的其他特征进行判断。
上图是一个自适应的感受野的路径。
Proposed Approaches
- Permutation Invariant
- Associative Property
- Adaptive Path Layer
- Adaptive breadth function: GAT
- Adaptive depth function: LSTM
实验
数据集:
- Pubmed
- BlogCatalog
- PPI
- Alipay
Baselines:
- MLP
- node2vec
- Chebyshev
- GCN
- GraphSAGE
- GAT
GeniePath 在大图上表现很好,且当层数增加时,分类的准确率不会有太大的影响。
思考
Critical thinking:
不同方法比较时参数的设置需要解释或者设置多种配置
Creative thinking:
对receptive path进行可视化,分析哪些因素对其有重要影响
How to apply to our work:
判断诈骗的模式可以看图的结构,同时学要结合节点本身的一些属性,可以将实验分为Transductive setting和Inductive setting。这样比较有说服力。