CS224W 图机器学习 1.1 介绍

Introduction

graph的分类

(1)Networks (also known as Natural Graphs):其实就是我们实际生活中会遇到的真实的图,比如社会人际关系、基因组、我们的想法

本质上这些是给定了一个domain,上面的所有信息可以建立一个networks,我们好利用networks/graphs更好的理解这个domain

(2)information graphs:这一类更关心的是各个个体之间的联系,从而可以做比如分类任务等

CS224W 图机器学习 1.1 介绍
img
CS224W 图机器学习 1.1 介绍
img

比如social networks:可以查询到谁follow了谁等信息;information networks可以查询谁引用了谁的文章等、或者研究科学的进化是一个怎样的进程

研究graph的目的/意义

CS224W 图机器学习 1.1 介绍
img

举一个笔者个人认为很重要的现实意义:目前新型冠状病毒,因为春运的原因,人员走动非常的广,没有办法人工去追踪,那么这时候利用大数据建立一个social networks,可以较好的将所有潜在的感染者找出来,从而切断传染源。

structure of graphs

怎么描述一个网络?

CS224W 图机器学习 1.1 介绍图其实是network的一种数学表示

  • networks可以视为一种通用的语言,用来描述不同domain下个体之间的联系。

  • 根据什么样的属性来考虑个体之间的联系,就称为xxxnetwork(xxx表示的就是你基于的联系属性)。

所以如何选择graph representation?

CS224W 图机器学习 1.1 介绍
img
  • undirected graphs(无向图):比如像微博上,我关注了你,你并没有关注我,我和你之间的这个联系并非是双向的

  • directed graphs(有向图):电话-一定有一人拨打电话和另一断接听电话,是双向的

CS224W 图机器学习 1.1 介绍
img

节点的度:(1)在undirected graph中这个度表明的就是这个节点连接的其他节点数量

我们也可以理解为微博中,你的粉丝数量+关注数量-互粉数量

(2)在directed graph中这个度反映的就更加精准:分为in-degree和out-degree

in-degree可以理解为粉丝数量,out-degree可以理解为关注数量(你关注别人)。注意到这里ppt上的C是没有双向箭头的。

有一类特殊的图:二分图

CS224W 图机器学习 1.1 介绍
img

这种图结构很有用:当你的nodes是不同的类型的时候,按照类型分类(disjoint sets)。如作者作为U类,论文作为V类。

怎么表示一个图?

(1)邻近矩阵A:通俗的理解就是将每个节点之间是否存在连接(1 or 0)通过矩阵形式表示出来

CS224W 图机器学习 1.1 介绍
img

我们可以试一下将0表示为白色,1表示为黑色点将邻近矩阵画出来:可以发现邻近矩阵是稀疏

CS224W 图机器学习 1.1 介绍
img

note

现实中大部分networks都是稀疏的(稀疏--非常好的性质

这样我们把graph表示成矩阵-稀疏矩阵,所占内存将减少很多

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-09-06
  • 2021-04-12
  • 2021-11-28
  • 2021-06-02
猜你喜欢
  • 2021-10-31
  • 2022-01-21
  • 2022-12-23
  • 2022-02-16
  • 2021-12-02
  • 2021-07-29
  • 2021-12-04
相关资源
相似解决方案