【发布时间】:2019-10-11 02:25:26
【问题描述】:
我有一个 pandas 数据集,其中一列是这样的:
Genre
------------
Documentary
Documentary
Comedy|Mystery|Thriller
Animation|Comedy|Family
Documentary
Documentary|Family
Action|Adventure|Fantasy|Sci-Fi
Crime|Drama|Mystery
Action|Crime|Mystery|Thriller
如何使用每个流派名称创建多个列,如果它包含该流派,则填写 1,否则填写 0?
预期输出:Pandas 数据框
Documentary Comedy Mystery Thriller Animation Family ......
1 0 0 0 0 0
1 0 0 0 0 0
0 1 1 1 0 0
等等。
我尝试使用先将其转换为列表然后拆分它,但这不是 pythonic 的方式。
我们可以使用apply 函数或其他一些有效的技术来有效地做到这一点吗?
【问题讨论】:
-
get_dummies? pandas.pydata.org/pandas-docs/stable/reference/api/…
标签: python-3.x pandas feature-extraction