【发布时间】:2019-01-01 21:12:48
【问题描述】:
我在 pandas Dataframe 中读取 csv 文件,然后获取它的 dummy 并将它们连接起来,但例如我有名为“Genre”的列,它包含“comedy, Drama”和“action, comedy”所以当我得到 dummy 和 concat它们为每个句子创建一个对象,但我想解析它们。例如,我想创建对象 'Genre.comedy'、'Genre.Drama'、 'Genre.action' 而不是 'Genre.comedy,drama'和'Genre.action,comedy' 这是我的代码:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import csv
from sklearn import preprocessing
trainset = pd.read_csv("/Users/yada/Downloads/IMDBMovieData.csv", encoding='latin-1')
X = trainset.drop(['Description', 'Runtime'], axis=1)
features = ['Genre','Actors']
for f in features:
X_dummy = pd.get_dummies(X[f], prefix = f)
X = X.drop([f], axis = 1)
X = pd.concat((X, X_dummy), axis = 1)
这是我的 csv 文件的某一行: csv
【问题讨论】:
-
请不要提供代码图片。
-
@Julien 现在准备好了 ;)
标签: python pandas csv parsing dummy-data