【发布时间】:2017-03-10 10:55:24
【问题描述】:
我有一个数据框,出于 MVP 的目的,它看起来像:
Val_x, Val_y
NaN, 2
1, Nan
我正在尝试生成一个新列val,它是这两者的串联。
目前我正在通过:
df['Val']=[df.iloc[j]['Val_x'] if pd.isnull(df.iloc[j]['Val_y']) else df.iloc[j]['Val_y'] for j in range(len(df))]
但这不是很高效,也不是很pythonic/pandas-native。
即我想到达:
Val_x, Val_y, val
Nan, 2, 2
1, NaN, 1
然后我可以在哪里做drop(val_x),drop(val_y)
如果有人有指点,我将不胜感激?
谢谢
编辑:
我正在尝试生成一个新列,它实际上是另外两列的“Non-NAN”值。这样做的原因是,出于技术原因,我不得不将我的数据框分成两个对象以进行不同的处理,现在希望重新加入它。所以我的原始数据框是index, val,我现在有一个新的数据框index, val_x, val_y,其中一些val_x 是NaN,而一些val_y 是NaN,但绝不是两者都有@ 987654332@,现在希望再次将其简化为一列
【问题讨论】:
-
你能解释一下你想做什么吗?
-
当然。我会更新 OP。