【发布时间】:2025-11-25 00:35:02
【问题描述】:
我有一个如下所示的示例数据框。我想建立一个基线模型来预测 y_combined 使用 X=df.filter(regex='x_'):
df = pd.DataFrame({
'x_1':[0.1,0.2,0.1,0],
'x_2':[0.5,0.1,0.3,0.4],
'x_3':[0.2,0.1,0.6,0.1],
'x_4':[0,0.5,0.2,0.3],
'y_1': [0, 1, 1, 0],
'y_2': [0, 0, 1, 0],
'y_3': [0, 1, 0, 1],
'y_combined': [np.array([0, 0, 0]), np.array([1, 0, 1]),
np.array([1, 1, 0]), np.array([0, 0, 1])]
})
我是基线模型构建的新手。要获取y_predicted,我应该如何使用strategy="constant" 指定DummyClassifer() 模型?还是我应该使用不同的策略?
例如,如果y_predicted = [1,1,1],那么我将通过获取y_combined 和y_predicted 之间的平均质心来查看预测模型的执行情况。
【问题讨论】:
标签: python machine-learning scikit-learn