【发布时间】:2019-08-30 04:54:20
【问题描述】:
我有一个数据框,其中一列的值就像是一个列表,但用返回字符(\n)而不是逗号分隔。我尝试使用 get_dummies 函数如下,但没有成功。
是否可以直接使用 get_dummies 函数?还是需要用逗号替换回车符?
# import xlsx:
parques = pd.read_excel('Tabelão.xlsx')
# get_dummies:
parques = pd.get_dummies(parques, columns = ['Atividades', 'Configuração'])
# Dataframe example:
Atividades = ['esportes\nrecreação infantil\ncontemplação', 'contemplação\nrecreação infantil\nesporte', 'contemplação\nrecreação infantil', 'contemplação\nrecreação infantil\neventos culturais']
Configuração = ['relevo plano\nriacho\nlagos\nbosque\nrede de lojas', 'beria-rio\nedificações\nesplandanadas\nrede de lojas', 'bosque\nrede de caminhos\nrecantos ', 'relevo predominantemente plano\nlago\nriacho']
Nome = ['Parque Julien Rien', 'Parque da Residência', 'Feliz Lusitânia', 'Parque Barigüi']
parques = pd.DataFrame([Nome, Atividades, Configuração])
parques = parques.T
parques.columns = ['Nome', 'Atividades', 'Configuração']
结果:所有值串联的列。
【问题讨论】:
-
使用
pd.Series.str.get_dummies,它允许您提供分隔符。可以为每一列单独执行此操作,添加前缀,然后连接结果。
标签: python-3.x pandas dataframe dummy-variable