【发布时间】:2017-04-27 08:55:45
【问题描述】:
数据是这样的:
features1 features2 labels
1 1 563 1
2 1 254 1
3 missing 145 1
4 0 126 1
5 0 145 0
6 1 124 0
7 0 456 0
我将把这些数据应用到 Tensorflow 训练过程中,所以我想对特征 1 的值进行 one-hot 编码。
上面数据的矩阵是:
[[1,563,1],
[2,254,1],
[missing,145,1],
[0,126,1],
[0,145,0],
[1,124,0],
[0,456,0]]
所以我认为它可以单热编码为:
> [1,0,0] represents 1
> [0,1,0] represents 0
> [0,0,1] represents 'missing'
我想要的输出是这样的:
[[1,0,0,563,1],
[1,0,0,254,1],
[0,0,1,145,1],
[0,1,0,126,1],
[0,1,0,145,0],
[1,0,0,124,0],
[0,1,0,456,0]]
我试过 pd.get_dummies。但我做不到。
【问题讨论】:
标签: python pandas tensorflow