【发布时间】:2018-11-11 23:04:50
【问题描述】:
例如,我有一个包含一列城市名称的 pandas DataFrame,并且我已经有一个大的预定义城市名称列表,将用作模型中的虚拟变量。我希望将列表中的每个城市名称添加为新列,然后填充一堆 0 和 1,其中城市名称列中的字符串与虚拟变量的列名称匹配。
从我的角度来看,我需要按照以下方式做一些事情:
for dv in dummy_var_list:
df[dv] = df[df[city_names]==dv]
我不确定这是否是一种有效或正确的方法。我需要加入某种我不确定该怎么做的“if”语句或掩码。
即我有城市名称列表:
['paris','sydney','orlando','milwaukee']
我有一个预定义的假人列表,我需要制作以下列:
['tokyo','berlin','beijing','orlando','paris']
所以有些行中不会有任何'1',因为没有匹配,但没关系。
【问题讨论】:
-
你能提供一个minimal reproducible example吗?