【发布时间】:2017-11-05 09:42:49
【问题描述】:
我是 python 的菜鸟。这里我有一个关于如何将数据重塑为 python 中的一个热门编码器的问题。 userid中的数字可重复的数据如下:
userid firstlogin
15605720 2017/4/20 0:00
24537631 2017/4/20 0:00
34012219 2017/4/20 0:00
……
32972232 2017/5/20 23:59
25698417 2017/5/20 23:59
31837935 2017/5/20 23:59
34092811 2017/5/20 23:59
我想把它转换成这样的一个热编码器:
userid 2017/4/20 2017/4/21 ……
25181024 1 0
21631446 1 1
31784326 0 1
32258942 1 1
12840021 1 1
32709432 1 1
……
首先,我应该学习哪个函数或方法来处理这个问题。非常感谢!
【问题讨论】:
标签: python data-cleaning one-hot-encoding