【问题标题】:Create A count Features right创建一个计数功能权
【发布时间】:2021-12-06 09:31:18
【问题描述】:

我有一张这样的桌子:

PC USER Period
A U1 2020/01
A U2 2020/02
A U3 2020/03
A U4 2020/04
B U1 2020/01
B U2 2020/02
B U2 2020/03

我需要创建一个“功能计数”来检查“PC”发现和“用户”连接了多少次

现在对于机器学习算法来说,最好的方法是什么? 甚至是它们的组合

  1. 每行显示最大连接数:
PC USER Period Max Con Per PC Max Con Per USER
A U1 2020/01 4 2
A U2 2020/02 4 3
A U3 2020/03 4 1
A U4 2020/04 4 1
B U1 2020/01 3 2
B U2 2020/02 3 3
B U2 2020/03 3 3
  1. 为每一行显示连接的计数:
PC USER Period Max Con Per PC Max Con Per USER
A U1 2020/01 1 1
A U2 2020/02 2 1
A U3 2020/03 3 1
A U4 2020/04 4 1
B U1 2020/01 1 2
B U2 2020/02 2 2
B U2 2020/03 3 3

【问题讨论】:

    标签: python pandas feature-engineering


    【解决方案1】:

    您可以使用groupby,然后使用transformcumcount

    # Use lazy groups
    gpc = df.groupby('PC')['PC']
    gus = df.groupby('USER')['Period']
    
    df['Max Con Per PC'] = gpc.transform('size')
    df['Count Con Per PC'] = gpc.cumcount() + 1
    df['Max Con Per USER'] = gus.transform('size')
    df['Count Con Per USER'] = gus.cumcount() + 1
    

    输出:

    >>> df
      PC USER   Period  Max Con Per PC  Count Con Per PC  Max Con Per USER  Count Con Per USER
    0  A   U1  2020/01               4                 1                 2                   1
    1  A   U2  2020/02               4                 2                 3                   1
    2  A   U3  2020/03               4                 3                 1                   1
    3  A   U4  2020/04               4                 4                 1                   1
    4  B   U1  2020/01               3                 1                 2                   2
    5  B   U2  2020/02               3                 2                 3                   2
    6  B   U2  2020/03               3                 3                 3                   3
    

    【讨论】:

    • 谢谢,但是对于机器学习算法来说,最好的方法是什么。做一个方法的组合??????
    • 你想做什么:分类还是回归?
    • 我该做什么分类谢谢!!!
    • 您的目标列 (y) 是什么?
    • 目标列“是欺诈” 是 1 否 0
    猜你喜欢
    • 2018-07-25
    • 1970-01-01
    • 2021-12-26
    • 2017-07-04
    • 1970-01-01
    • 2019-10-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多