【发布时间】:2021-12-06 09:31:18
【问题描述】:
我有一张这样的桌子:
| PC | USER | Period |
|---|---|---|
| A | U1 | 2020/01 |
| A | U2 | 2020/02 |
| A | U3 | 2020/03 |
| A | U4 | 2020/04 |
| B | U1 | 2020/01 |
| B | U2 | 2020/02 |
| B | U2 | 2020/03 |
我需要创建一个“功能计数”来检查“PC”发现和“用户”连接了多少次
现在对于机器学习算法来说,最好的方法是什么? 甚至是它们的组合
- 每行显示最大连接数:
| PC | USER | Period | Max Con Per PC | Max Con Per USER |
|---|---|---|---|---|
| A | U1 | 2020/01 | 4 | 2 |
| A | U2 | 2020/02 | 4 | 3 |
| A | U3 | 2020/03 | 4 | 1 |
| A | U4 | 2020/04 | 4 | 1 |
| B | U1 | 2020/01 | 3 | 2 |
| B | U2 | 2020/02 | 3 | 3 |
| B | U2 | 2020/03 | 3 | 3 |
- 为每一行显示连接的计数:
| PC | USER | Period | Max Con Per PC | Max Con Per USER |
|---|---|---|---|---|
| A | U1 | 2020/01 | 1 | 1 |
| A | U2 | 2020/02 | 2 | 1 |
| A | U3 | 2020/03 | 3 | 1 |
| A | U4 | 2020/04 | 4 | 1 |
| B | U1 | 2020/01 | 1 | 2 |
| B | U2 | 2020/02 | 2 | 2 |
| B | U2 | 2020/03 | 3 | 3 |
【问题讨论】:
标签: python pandas feature-engineering