【发布时间】:2019-02-10 18:59:16
【问题描述】:
正如标题所指出的,我正在尝试获取一个重复行的数据框。 决定 N 次重复执行的因素基于原始数据帧中存在的特定列的唯一值的长度。 执行重复过程后,我想创建一个新列,将原始数据框特定列的所有相同唯一值应用于创建的每个新行。
我知道这有点令人困惑,但我无法尝试以更好的方式揭露我的疑问。因此,为了便于您理解我想要的方法,我们简要介绍了我的数据框和所需的输出数据框:
>> Original Dataframe
Samp Age Cs
1 A 51 msi
2 B 62 cin
3 C 55 msi
4 D 70 ebv
5 E 56 gs
....
如您所见,我的 Cs 列有 4 个唯一值(对于不同的数据框可能并不总是相同)。所以,我的目标是获得具有以下结构的数据框:
>> Desired Dataframe
Samp Age Cs
1 A 51 msi
1 A 51 cin
1 A 51 ebv
1 A 51 gs
2 B 62 cin
2 B 62 msi
2 B 62 gs
2 B 62 ebv
3 C 55 msi
3 C 55 cin
3 C 55 ebv
3 C 55 gs
4 D 70 ebv
4 D 70 cin
4 D 70 msi
4 D 70 gs
5 E 56 gs
5 E 56 cin
5 E 56 msi
5 E 56 ebv
....
如您所见,在我想要的数据框中,所有行都重复了 4 次(等于唯一 Cs 列值的数量),Cs除外> 列(将其所有唯一值应用于不同的行)。
【问题讨论】:
标签: python pandas dataframe rows repeat