【发布时间】:2018-08-03 17:42:19
【问题描述】:
我有一个 DataFrame,其中每行有两列:日期和提及。最终结果将是每个日期提及的数据框,如果我可以分解提及,那么通过 GroupBy 应该很容易,这就是我卡住的地方。原始数据如下所示:
date mentions
2018-01-01 alpha, beta, gamma
2018-01-01 alpha
2018-01-02 beta
2018-01-03 delta
2018-01-05 alpha
2018-01-07 alpha
2018-01-10 delta, gamma
2018-01-11 gamma
我需要转换成这个:
date mentions
2018-01-01 alpha
2018-01-01 beta
2018-01-01 gamma
2018-01-01 alpha
2018-01-02 beta
2018-01-03 delta
2018-01-05 alpha
2018-01-07 alpha
2018-01-10 delta
2018-01-10 gamma
2018-01-11 gamma
最终状态应该如下所示,我可以通过 GroupBy 值计数(加上重新索引)得到:
date alpha beta gamma delta
2018-01-01 2 1 1 0
2018-01-02 0 1 1 0
2018-01-03 0 0 0 1
2018-01-04 0 0 0 0
2018-01-05 1 0 0 0
2018-01-06 0 0 0 0
2018-01-07 1 0 0 0
2018-01-08 0 0 0 0
2018-01-09 0 0 0 0
2018-01-10 0 0 1 1
2018-01-11 0 0 1 0
我在其他地方看到过这个问题的变化,但和我的不太一样,我觉得这很简单,我只是没有看到正确的解决方案。
【问题讨论】: