【发布时间】:2020-01-13 14:52:10
【问题描述】:
我有一个包含许多二进制变量的数据框,我想根据其中许多二进制变量创建一个具有分类值的新变量
我的数据框是这样的
gov_winner corp_winner in part
1 0 0
0 1 0
0 0 1
我要创建的变量名为winning_party,看起来像这样
gov_winner corp_winner in part winning_party
1 0 0 gov
0 1 0 corp
0 0 1 in part
我开始尝试以下代码但尚未成功:
harrington_citations = harrington_citations.assign(winning_party=lambda x: x['gov_winner']
== 1 then x = 'gov' else x == 0)
使用 anky_91 的回答我得到以下错误:
TypeError: can't multiply sequence by non-int of type 'str'
【问题讨论】:
-
只有
1和0填充的列? -
df@df.columns有效吗?
标签: python pandas variables binary categorical-data