【发布时间】:2020-12-08 00:16:29
【问题描述】:
我有一个推文数据框,并相应地制作了一个 user_table。我想看看哪些用户最活跃。
我已经能够删除重复值了
from collections import Counter
user_list = user_table['user.id'].tolist()
user_count = Counter(user_list) # get dictionary count
user_table.drop_duplicates(subset='user.id', keep = 'first', inplace = True) # drops duplicate values
但是我即将将每个 id 匹配到适当的字典并分配给排序列表,将其转换为 pandaseries,然后在 user_table 中为其分配一个列,但我觉得应该有一个更简化的方法
【问题讨论】:
标签: python database dataframe counter series