python k-means聚类文本

【问题标题】：python k-means clustering textpython k-means聚类文本
【发布时间】：2016-08-14 19:07:18
【问题描述】：

我正在尝试寻找一个示例来帮助我对我拥有的一些文本数据进行聚类。数据格式为：

A,B,3
C,D,5
A,D,57

前两个条目是一对的成员，数字是这对在数据集中出现的频率。我有超过 200,000 对独特的配对。

有什么建议吗？谢谢！！

【问题讨论】：

您的问题到底是什么？你试过什么？
几乎只是试图找到一段与我正在尝试做的事情类似的代码。我发现的只是对文档进行聚类的代码，而不是对。问题是，我收到的描述/要求可能是错误的。谢谢你的回答！

标签： python-2.7 scikit-learn cluster-analysis k-means

【解决方案1】：

不要对此类数据使用 k-means。

它不会起作用。

您拥有的是相似度矩阵，而不是 k-means 所需的连续向量。您可以尝试分层聚类（具有稀疏相似性，不是距离；不，我不会为您编写代码）。

【讨论】：

谢谢！我绝不是要求任何人给我写代码，但我很难找到与我正在尝试做的事情相似的任何事情。这说明了为什么会这样。谢谢。

猜你喜欢

2019-04-06
2016-02-01
2018-01-18
2017-03-16
2015-04-11
2011-08-13
2013-08-08
2013-02-14
2018-01-14

相关资源

下载 2023-03-07
下载 2021-06-06
下载 2022-12-14
下载 2023-04-02

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode