【发布时间】:2021-01-30 17:18:38
【问题描述】:
我有一个大型数据集,由 9664 行组成。我对编码非常陌生,所以我很感激任何帮助! .
这就是我的数据:
UserId Date Part_of_day Apps Category Frequency Duration_ToT
1 2020-09-10 evening Settings System tool 1 3.436
1 2020-09-11 afternoon Calendar Calendar 5 9.965
1 2020-09-11 afternoon Contacts Phone_and_SMS 7 2.606
2 2020-09-11 afternoon Facebook Social 15 50.799
2 2020-09-11 afternoon clock System tool 2 5.223
3 2020-11-18 morning Contacts Phone_and_SMS 3 1.726
3 2020-11-18 morning Google Productivity 1 4.147
3 2020-11-18 morning Instagram Social 1 0.501
.......................................
67 2020-11-18 morning Truecaller Communication 1 1.246
67 2020-11-18 night Instagram Social 3 58.02
我想按持续时间和频率获取每个用户使用的类别的平均值。我试图用许多时间段内使用的平均类别来代表每个用户。
【问题讨论】: