【发布时间】:2020-07-25 12:51:30
【问题描述】:
这是我在上面使用的 pandas 数据框。形状为 (1049,3)
我是初学者,在尝试实现回答的目标时遇到了一些困难 "年复一年流行哪种类型"1) release_year = 1960 到 2015 年,包括多个相同年份(整数)
2) 流派 = 20 种类型(对象)
3) 没有缺失值我已经尝试过了,但我收到一条错误消息,提示我无法使用 irow
genre.groupby('release_year').apply(lambda genre:genre.irow(genre.value.argmax()))
最终我想要看起来像这样的东西......(x,y)
popular_genre
release_year
1960 Drama
1961 Comedy
1962 Action
.
.
2015 Science Fiction
所以我可以使用直方图或线条来绘制它。如果用这么多 x 值绘制图表太难看,我可能不得不将年份划分为几十年。
我最初的计划是首先找到每年数量最多的流派,然后将其放入 Dataframe 或制作一个新流派
还是我想太多了,有没有办法通过绘图来绕过这个?
提前谢谢大家:)
【问题讨论】:
标签: pandas numpy lambda group-by max