【发布时间】:2016-08-14 19:07:18
【问题描述】:
我正在尝试寻找一个示例来帮助我对我拥有的一些文本数据进行聚类。数据格式为:
A,B,3
C,D,5
A,D,57
前两个条目是一对的成员,数字是这对在数据集中出现的频率。我有超过 200,000 对独特的配对。
有什么建议吗?谢谢!!
【问题讨论】:
-
您的问题到底是什么?你试过什么?
-
几乎只是试图找到一段与我正在尝试做的事情类似的代码。我发现的只是对文档进行聚类的代码,而不是对。问题是,我收到的描述/要求可能是错误的。谢谢你的回答!
标签: python-2.7 scikit-learn cluster-analysis k-means