【发布时间】:2017-06-19 12:48:06
【问题描述】:
我有以下数据框:
df1:
2000 2001 2002
a a a
b b c
c c d
因此,在 2002 年,值 b 被 c 取代。我现在想要的是对于每一列,检查列的每个值,即分别针对 a、b 和 c,是否是下一列的成员。然后,我想要 a、b、c 和 d 的输出,指示字符串成为第一个成员的日期以及它停止成为成员的日期。像这样:
df2:
a b c d
2000 2000 2000 2002
NaN 2002 Nan NaN
谁能帮助我如何在 python 中实现这一点?
编辑:这是我开始的方式,但我不知道如何在 python 中实现它。
for c in columns:
for v in column:
drop v if v is not in c_[+1]
remove all empty columns
理论上,这应该给我一个数据框,只显示带有已删除值的日期。例如:
df2:
2002
b
然后我会做一个类似的分析,但对于添加的值,然后合并两个数据框。但是,我不知道如何将每一列准确地转换为一个列表并检查 v 是否是该列表的一部分,然后转到下一列。
【问题讨论】:
-
您有解决方案的尝试吗?
-
这是做作业的吗?不知道我是否应该为你写一个算法..
-
不,这不是作业。我在上面添加了一个尝试
标签: python pandas string-comparison