【发布时间】:2014-09-07 13:34:15
【问题描述】:
我有一个数据集 df,有两个变量 x 和 y。我想编写一个执行以下操作的函数:
x if x>100 and y
我习惯在 STATA 中进行数据分析,所以我对 pandas 进行数据分析比较陌生。如果有帮助,在 stata 中它看起来像:
替换 x = cond(x>100 & y
换句话说,该函数以 df 中的两列为条件,并将根据条件是否满足而从每一行中的一个变量或另一个变量返回一个值。
到目前为止,我一直在通过新函数创建新变量,例如:
df.dummyVar = df.x.apply(lambda x: 1 if x>100 else 0)
使用 StackOverflow 和文档,我只能找到如何将依赖于单个变量的函数应用于多个列(使用轴选项)。请帮忙。
【问题讨论】:
标签: python lambda pandas conditional multiple-columns