【发布时间】:2012-09-10 14:52:25
【问题描述】:
我有一个有向图(实际上它是一个超图,但暂时可以忽略它)。
从这个图中我选择了各种子图,并且我正在寻找一个函数,它可以根据它们的“集群质量”对各种此类子集进行排名。
当子集的成员之间存在大量链接时,“集群质量”应该很高
当从子集的许多成员到子集或从子集外部存在大量链接时,“集群质量”应该很低。
我的问题是:
“集群质量”的正确术语是什么?
在这种情况下确实存在哪些相关算法/函数?
JVM 上存在哪些实现。首选 Scala,但任何可从 java 调用的东西都可以吗?
背景:这个想法是从源代码(类和方法名称或其中的部分)中提取单词,并通过找到那些被“好集群”使用的词来找到那些可能最好地描述应用程序的词,从而可能代表一些知识概念代码。
【问题讨论】:
标签: graph cluster-analysis ranking