【发布时间】:2014-07-14 15:56:26
【问题描述】:
在将训练数据集提供给聚类模型之前,我正在使用 StandardScaler 转换数据。
X = StandardScaler().fit_transform(X_train)
假设,clf 是无监督集群模型,我预测标签如下:
y = clf.predict(X)
问题:如何组合“y”和“X_train”numpy 数组?我不确定 StandardScaler() 是否保持矩阵内的顺序。那么,这行得通吗?
df = pd.DataFrame(np.array(X_train), np.array(y))
【问题讨论】:
标签: python-2.7 preprocessor cluster-analysis unsupervised-learning