【问题标题】:Clustering algorithm for grouping based on y distance from 0基于y距离0进行分组的聚类算法
【发布时间】:2018-08-22 03:25:50
【问题描述】:

为了建立一个监督学习模型,我每天对感兴趣的变量进行 st.dev。我想找到每日 st.dev 的集群,即第 1 组具有最小的 st.dev,第 2 组具有更大的等等。

聚类结果将为 CART 算法提供分类标签。怀疑有4个类。

我有一个二维矩阵,日期为“X”,每日 st.dev 为“y-true”。将日期列转换为数字后:

mat.X = pd.to_numeric(mat['X']) 

在 sklearn 库中使用 k-means,结果如下:

kmeans = KMeans(n_clusters=3)
kmeans = kmeans.fit(mat)]
labels = kmeans.predict(mat)
plt.scatter(mat[:,0],mat[:,1], c=kmeans.labels_, cmap='rainbow')  

结果没有对Y轴的st.dev数据进行聚类。这是一个好的方法吗?是否应该切换列以对 st.dev 数据进行聚类?

【问题讨论】:

    标签: python machine-learning scikit-learn


    【解决方案1】:

    您说您只想在 std-dev 上进行集群,但您是在两个维度上进行集群,即 std-dev 和日期。

    试试这个。

    kmeans = KMeans(n_clusters=3)
    kmeans = kmeans.fit(mat[:, 1])] 
    labels = kmeans.predict(mat[:, 1])
    plt.scatter(mat[:,0],mat[:,1], c=labels, cmap='rainbow')
    

    【讨论】:

      猜你喜欢
      • 2019-12-27
      • 1970-01-01
      • 1970-01-01
      • 2011-12-09
      • 2017-04-07
      • 2013-04-21
      • 2019-10-24
      • 1970-01-01
      • 2016-07-07
      相关资源
      最近更新 更多