【问题标题】:Unsupervised machine learning with scikit learn使用 scikit learn 进行无监督机器学习
【发布时间】:2019-04-16 00:34:49
【问题描述】:

我正在使用 scikit learn 学习无监督机器学习。我从网上收集了这些数据。当我尝试应用散点图时,出现以下错误

IndexingError:索引器过多

代码如下:

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
X_com = df.att10
plt.scatter(X_com.iloc[:,0],X_com.iloc[:,1])
plt.show()

我想在这里申请来自 scikit learn 的 KMeans 算法。我做错了什么?提前致谢

【问题讨论】:

    标签: python pandas scikit-learn unsupervised-learning


    【解决方案1】:

    您可能希望查看前两个特征的数据分布情况。然后你必须从初始数据集而不是从系列中分割它(正如@Alexandre 提到的)

    data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
    df = pd.DataFrame(data[0])
    df = df.drop(['outlier',"id"],axis=1)
    plt.scatter(df.iloc[:,0],df.iloc[:,1])
    plt.show()
    

    【讨论】:

      【解决方案2】:

      X_com 是一个 pd.Series,因此当您尝试使用 .iloc 对其进行切片时,您只能指定一个轴。

      【讨论】:

        猜你喜欢
        • 2017-08-22
        • 2019-02-08
        • 2017-02-28
        • 2020-12-10
        • 2014-04-20
        • 2017-08-18
        • 2016-05-28
        • 2013-03-24
        相关资源
        最近更新 更多