【发布时间】:2015-11-17 11:41:51
【问题描述】:
我正在研究 DBLP 数据集(包含超过 180 万份出版物的元数据,由超过 100 万位作者在数千种期刊或会议论文集中撰写),其中包含以下列 -
['id', 'title', 'authors', 'year', 'pub_venue', 'ref_id', 'ref_num', 'abstract']
我必须在给定的数据集上应用社区检测算法。我的要求是 获得重叠的社区。 为此,我使用上述数据在 igraph 中创建了一个图,其中 id 是一个顶点值, ref_id 中的 id 将用于创建边。我尝试了 igraph 中可用的不同社区检测算法,但没有得到想要的结果 -
我正在使用 -
community_multilevel()
我从这个算法得到的结果集群只给了我最好的模块化分区。我想了解如何获取不同级别或树状图的集群?
编辑:我使用了 community_multilevel(return_levels= True) 并且对于上面的数据集,它制作了一个稀疏图,我的期望是在更高级别获得密集社区,但我在每个级别获得的社区数量几乎相同减少了很多。我需要类似于 networkx 中的 parition_at_level 的东西。
Total no of vertices : 1632441
cl = g.community_multilevel(return_levels=True)
print len(cl[0]) , len(cl[1]) , len(cl[2]) , len(cl[3])
output is : 1207787 1164960 1162115 1161959
【问题讨论】: