【发布时间】:2018-03-15 03:55:05
【问题描述】:
我有一个 pandas 数据框,其中包含给定时间段的查询和计数,我希望将此数据框转换为唯一词的计数。例如,如果数据框包含以下内容:
query count
foo bar 10
super 8
foo 4
super foo bar 2
我希望收到以下数据框。例如单词“foo”在表中出现了 16 次。
word count
foo 16
bar 12
super 10
我正在使用下面的函数,但这似乎不是执行此操作的最佳方法,它忽略了每行的总数。
def _words(df):
return Counter(re.findall(r'\w+', ' '.join(df['query'])))
任何帮助将不胜感激。
提前致谢!
【问题讨论】:
标签: python pandas group-by pandas-groupby