【问题标题】:How to reshape the data become one hot encoder in python?如何重塑数据成为python中的一个热门编码器?
【发布时间】:2017-11-05 09:42:49
【问题描述】:

我是 python 的菜鸟。这里我有一个关于如何将数据重塑为 python 中的一个热门编码器的问题。 userid中的数字可重复的数据如下:

userid  firstlogin
15605720    2017/4/20 0:00
24537631    2017/4/20 0:00
34012219    2017/4/20 0:00
……
32972232    2017/5/20 23:59
25698417    2017/5/20 23:59
31837935    2017/5/20 23:59
34092811    2017/5/20 23:59

我想把它转换成这样的一个热编码器:

userid  2017/4/20   2017/4/21   ……
25181024    1   0
21631446    1   1
31784326    0   1
32258942    1   1
12840021    1   1
32709432    1   1
……

首先,我应该学习哪个函数或方法来处理这个问题。非常感谢!

【问题讨论】:

    标签: python data-cleaning one-hot-encoding


    【解决方案1】:

    第一步是从 firstlogin 中提取日期部分。然后将其转换为对象,然后使用枢轴创建虚拟变量。

    oh['dt']=oh['firstlogin'].dt.date
    oh['dummies'] = 1
    oh.pivot(index='userid', columns='dt', values='dummies')
    

    一般来说,你应该分享你已经取得的进展并描述瓶颈。如果没有这个,专家将不会做出回应,这可能是迄今为止没有回应的原因。

    【讨论】:

      猜你喜欢
      • 2019-07-06
      • 1970-01-01
      • 1970-01-01
      • 2020-06-16
      • 2020-09-18
      • 1970-01-01
      • 2023-03-13
      • 2020-01-30
      • 1970-01-01
      相关资源
      最近更新 更多