【发布时间】:2019-11-12 10:46:03
【问题描述】:
我使用 get_dummies 对数据框中的一列进行了虚拟化处理,但这又产生了 400 列。问题是我想对现在有超过 700 列的数据框进行子集化,以便在操作下运行
replace([np.inf, -np.inf], np.nan).dropna()
我尝试通过将 get_dummies 生成的新列存储在我初始化为 col1 的列表中来隔离它们。 当我尝试使用
对 df 进行子集化时df = df[['var1','var2','var3',[col1] ]]
我收到一条错误消息,提示“ValueError: setting an array element with a sequence''
有没有一种方法可以在子集时不必全部输入新的虚拟对象?
【问题讨论】:
标签: python list dataframe subset