【发布时间】:2023-03-23 09:53:01
【问题描述】:
在一个 jupyter 笔记本中,我有一个从不同的合并数据集创建的数据框。
record_id | song_id | user_id | number_times_listened
0 |ABC | Shjkn4987 | 3
1 |ABC | Dsfds2347 | 15
2 |ABC | Fkjhh9849 | 7
3 |XYZ | Shjkn4987 | 20
4 |XXX | Shjkn4987 | 5
5 |XXX | Swjdh0980 | 1
我想通过 song_id 创建一个数据透视表数据框,列出 user_id 的数量和 number_times_listened 的总和。
我知道我需要使用 count 和 sum 函数创建一个 for 循环,但我无法让它工作。我还尝试了 pandas 模块的 pd.pivot_table。
df = pd.pivot_table(data, index='song_ID', columns='userID', values='number_times_listened', aggfunc='sum')
或类似的东西?
total_user=[]
total_times_listened =[]
for x in data:
total_user.append(sum('user_id'))
total_times_listened.append(count('number_times_listened'))
return df('song_id','total_user','total_times_listened')
【问题讨论】:
标签: python pandas pivot-table