【发布时间】:2014-05-25 00:53:23
【问题描述】:
我正在做一个基于代理的建模,目前在 Python 中进行了设置,但如果需要,我可以切换到 Java。
我在 Twitter 上有一个数据集(1100 万个节点和 8500 万条有向边),并且我已经设置了一个字典/哈希图,以便键是特定用户 A,它的值是所有关注者的列表(关注用户的人一种)。 “节点”实际上只是整数 ID 号(唯一),没有其他数据。我希望能够通过某种聚类方法可视化这些数据。并非所有单个节点都必须被可视化,但我希望具有最多 n 个关注者的节点能够被清晰地可视化,并且该节点周围的区域将代表所有关注它的人。我正在对整个地图的分布进行建模,因此我需要节点和节点周围的区域来更改颜色。理想情况下,这将是一个连续的可视化,但我不介意它只是在每次迭代时拍摄快照。
此外,我正在考虑将集群分开,以便:
如果 A 和 B 有足够的追随者可以单独可视化,并且 A 和 B 是连接的(一个跟随另一个,甚至可能是双向),那么它们都是可视化的,但是尽管连接,但在视觉上彼此分离,所以可视化更清晰。
无论如何,我想知道 Python(最好)或 Java 中是否有一个包可以让人们轻松地完成这个。
【问题讨论】:
标签: python cluster-analysis packages data-visualization agent-based-modeling