【发布时间】:2020-10-24 19:47:49
【问题描述】:
我的 jupyter notebook 中有以下数据集作为输入:
Product Year Variable
A 2018 2
A 2019 4
B 2018 2
B 2019 3
我想知道在我的数据集中创建循环或其他东西或排序的最快方法是什么,以便我得到以下输出:
Product Year Variable Row_Num
A 2018 2 1
A 2018 2 2
A 2019 4 1
A 2019 4 2
A 2019 4 3
A 2019 4 4
B 2018 2 1
B 2018 2 2
and so on...
TL;DR - 基于特定列中的变量,我想创建行。例如,如果变量为 3,我想创建该行的 3 个副本,其中有一列的值为 1、2、3。
我认为我找到的一种方法是首先根据我的变量创建重复项,然后使用类似于 rank() 或 row_number() 的函数来创建我的“row_num”列。如果任何人都可以分享其他可能的方法来做同样的事情,那将会很有帮助。 ????
【问题讨论】:
-
欢迎来到 SO。请在您的问题中同时包含输入和预期输出作为文本,以便其他人可以轻松复制它。
-
@Roy2012 谢谢罗伊,我已经更新了。希望这对每个人都有帮助。
-
在下面查看我的答案。