【发布时间】:2020-08-04 12:50:50
【问题描述】:
我一直在尝试基于 SGD 模型参数(系数和截距)进行聚类。 coef_ 持有权重 w,intercept_ 持有 b。 这些参数如何与一组学习模型上的聚类 (KMedoids) 一起使用?
import numpy as np
from sklearn import linear_model
X = np.array([[-1, -1], [-2, -1], [1, 1], [2, 1]])
Y = np.array([1, 1, 2, 2])
clf = linear_model.SGDClassifier()
clf.fit(X, Y)
所以我想为每个学习模型基于clf.coef_ (array([[19.47419669, 9.73709834]])) 和clf.intercept_ (array([-10.])) 进行聚类。
【问题讨论】:
-
嗨,欢迎来到 StackOverflow。我觉得这个问题有点难理解,你说的基于SGD模型参数的聚类是什么意思?
-
我的意思是基于 SGD 模型参数(coef_ 和 intercept_)的聚类,而不是使用 X 值(数据点)@JohannesAck
-
是的,但是系数和截距参数是学习模型的参数,而不是数据点的参数。因此它只是一组参数,聚类在这里没有多大意义。您是否可能想使用 SGD 模型来预测每个 X 的潜在去噪 Y 值,然后对这些“去噪”(x,y) 对进行聚类?
-
@JohannesAck,我想根据学习模型的参数(系数和截距参数)对它们进行聚类?因为这部分是我分布式机器学习大代码的一部分
-
首先,我应该同时使用(系数和截距参数)吗?第二怎么办?因为他们有不同的向量?
标签: python intercept feature-clustering