【发布时间】:2019-07-03 14:54:18
【问题描述】:
我对 NetworkX 有一个奇怪的问题。
给定DS-1 dataset,我的任务是每年创建一个在数据集中报告的图表。到目前为止,完全没有问题。对于 2013 年,这就是我得到的
我们可以说...有点拥挤。
现在这是我的奇怪问题。我的作业表明我应该按照某种逻辑选择每个图的顶部 k 节点。所以,由于我有一些节点少于 5 个的图(并且,根据要求,这个 k 将是 [0,5,10,50,200] 中的一个值),我想在迭代中排除那些 len(G ) 是
for x in graphsPerYear:
G = graphsPerYear[x]
if len(G) < k:
print(G.nodes)
print(G.number_of_nodes())
print("Skipping year " + str(x) + " since it has " + str(len(G)) + " nodes which is less than the prompted k")
continue
这会输出以下内容:
['linear matrix inequality', 'social inequality']
2
Skipping year 2013 since it has 2 nodes which is less than the prompted k
但图片却完全相反。我错过了什么?
编辑
添加图表的创建
def createGraphPerYear(dataset, year):
insertedWords = set()
listaAnni = set(dataset['anno'].values)
grafi = dict()
for anno in listaAnni:
datasetTemporale = dataset[dataset['anno'] == anno]
G=nx.DiGraph()
for index, row in datasetTemporale.iterrows():
#Reminder: ogni row è formato da anno, keyword1, keyword2, dizionario utilizzatore keywords - numero volte
#FASE 1: AGGIUNTA DEI DUE POSSIBILI NODI
if row.keyword1 not in G:
G.add_node(row.keyword1)
if row.keyword2 not in G:
G.add_node(row.keyword2)
if not __areNodesConnected(G,row.keyword1, row.keyword2):
G.add_edge(row.keyword1,row.keyword2)
grafi[anno] = G
return grafi
def __areNodesConnected(G, nodeToCheckOne,nodeToCheckTwo):
return nodeToCheckOne in G.neighbors(nodeToCheckTwo)
【问题讨论】:
-
注释:对于
DiGraph,如果从u到v已经存在边,则命令G.add_edge(u,v)将不起作用。否则,如果这些节点中的任何一个不存在,它将首先添加节点,然后创建边。所以你在for循环中的if语句可以被删除,__areNodesConnected就不需要了。 [同样__areNodesConnected等同于G.has_edge(nodeToCheckOne,nodeToCheckTwo)]。 -
我很确定问题出在您未显示的其他代码中。您能否为
2013绘制图表并检查它是否与您显示的图相似,然后立即检查len(G)? -
@Joel 所以这就是我所做的:采用迭代 graphsPerYear 的 for,在 G 初始化之后,我放了一个 nx.draw(G) plt.show(),紧接着,一个打印(长度(G))。输出是 170,这对我来说很酷(P.S.:感谢您的评论!)