使用 scikit learn 进行无监督机器学习答案

【问题标题】：Unsupervised machine learning with scikit learn使用 scikit learn 进行无监督机器学习
【发布时间】：2019-04-16 00:34:49
【问题描述】：

我正在使用 scikit learn 学习无监督机器学习。我从网上收集了这些数据。当我尝试应用散点图时，出现以下错误

IndexingError：索引器过多

代码如下：

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
X_com = df.att10
plt.scatter(X_com.iloc[:,0],X_com.iloc[:,1])
plt.show()

我想在这里申请来自 scikit learn 的 KMeans 算法。我做错了什么？提前致谢

【问题讨论】：

标签： python pandas scikit-learn unsupervised-learning

【解决方案1】：

您可能希望查看前两个特征的数据分布情况。然后你必须从初始数据集而不是从系列中分割它（正如@Alexandre 提到的）

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
plt.scatter(df.iloc[:,0],df.iloc[:,1])
plt.show()

【讨论】：

【解决方案2】：

X_com 是一个 pd.Series，因此当您尝试使用 .iloc 对其进行切片时，您只能指定一个轴。

【讨论】：