【问题标题】:Clustering plot in one-dimension data in PythonPython中一维数据中的聚类图
【发布时间】:2021-08-02 21:12:45
【问题描述】:

我有一个包含三列数千行的数据集,如下所示。

classes (clusters) 的数量为 4,如第三列 (R, I, C, F) 所示。

row id     VALUE    CLASS  
   1        284         R  
   2        254         I
   3        184         C 
   4        177         F      

..........
  • 我正在尝试根据 4 个类从上述数据中获取聚类图。预期输出如下图所示。

我尝试了什么: seaborn中的散点图

from pandas import read_csv
import seaborn as sns

df2 = read_csv(r'C:\Users\jo\Downloads\Clusters.csv')

sns.scatterplot(data=df2, x="VALUE", y= "rowid",hue="CLASS")

【问题讨论】:

  • 你只有1个变量,你怎么做散点图

标签: python matplotlib plot seaborn cluster-analysis


【解决方案1】:

好吧,我不得不说,聚类算法几乎肯定在做它应该做的事情。当然,聚类是无监督的,因此您没有任何培训/测试,也不知道结果会是什么。您可以输入不同的功能,看看结果如何。此外,您并没有真正共享任何代码,因此无法确定这里发生了什么。我建议看看下面的链接,并在这个主题上做更多的谷歌搜索。

https://github.com/ASH-WICUS/Notebooks/blob/master/Clustering%20-%20Historical%20Stock%20Prices.ipynb

https://www.askpython.com/python/examples/plot-k-means-clusters-python

https://towardsdatascience.com/visualizing-clusters-with-pythons-matplolib-35ae03d87489

【讨论】:

  • 共享链接仍然在第一个链接中提供输入数据,例如prices_list。但是根据给定的建议集群没有任何培训/测试?我的问题是可以基于single dimension data 或单列绘制集群图吗?我们确信可以使用two dimension data 或 2 列数据来实现绘图。
  • 我不认为你可以基于一列进行聚类实验。
猜你喜欢
  • 2021-08-24
  • 2021-05-25
  • 2017-08-28
  • 2017-01-26
  • 2016-06-01
  • 2013-05-17
  • 2012-01-02
  • 2012-07-15
  • 1970-01-01
相关资源
最近更新 更多