【发布时间】:2020-10-03 15:43:05
【问题描述】:
数据集
我有一个电影数据集,其中有超过 50 万行,这个数据集如下所示(带有虚构的数字)
MovieName Date Rating Revenue
A 2019-01-15 3 3.4 million
B 2019-02-03 3 1.2 million
... ... ... ...
对象
选择上映日期“足够接近”的电影(例如电影 A 和电影 B 的上映日期相差不到一个月),看看什么时候评分相同,收入如何不同.
问题
我知道我可以编写一个双循环来实现这个目标。但是,我怀疑这是正确/有效的方法,因为
- 一些posts(请参阅@cs95 对问题的评论)建议对数据框进行迭代是“反模式”,因此不建议这样做。
- 数据集有超过 50 万行,我不确定编写双循环是否有效。
有人可以指点我的问题吗?提前谢谢你。
【问题讨论】:
-
请显示预期输出和更多示例数据。