【发布时间】:2017-11-16 20:19:18
【问题描述】:
我正在尝试构建一个神经网络来预测每个网球运动员在互相比赛时赢得发球点的概率。对于输入,我将使用每个玩家参加的最后一次N 比赛,计算与对手的排名差异以及他在比赛中赢得一分的实际概率。
例如,每个玩家只查看 2 场比赛,一个输入将是
i=[-61, 25, 0.62, 0.64, 2, -35, 0.7, 0.65]
前 4 个数字用于第 1 名玩家(排名差异和他的概率),其他 4 个用于第二名。 输出将是
o=[0.65, 0.63]
所以训练输入是X=[i1, i2, i3,...],输出是y=[o1, o2, o3,...]
我有几个新手问题:
- 是否有必要对整个数据集的输入(分别为等级和概率)进行归一化?
- 当我尝试在 python 中运行它时,它说
ValueError:标签二值化不支持多输出目标数据
我可以让 MLPClassifier 使用 2 个输出吗?
编辑:添加了一些代码
from sklearn.neural_network import MLPClassifier
clf = MLPClassifier(solver='lbfgs', alpha=1e-5,
hidden_layer_sizes=(5, 2), random_state=1)
X=[[-61, 25, 0.62, 0.64, 2, -35, 0.7, 0.65], [2,-5,0.58,0.7,-3,-15,0.65,0.52] ]
y=[ [0.63, 0.64], [0.58,0.61] ]
clf.fit(X,y)
该代码返回上述错误。数据在这里没有被规范化,但我们暂时忽略它。
【问题讨论】:
标签: python scikit-learn neural-network