【发布时间】:2015-09-04 00:03:46
【问题描述】:
我正在尝试使用 pandas 将分类值转换为二进制值。这个想法是将每个唯一的分类值视为一个特征(即一列),并根据是否将特定对象(即行)分配给该类别来放置 1 或 0。以下是代码:
data = pd.read_csv('somedata.csv')
converted_val = data.T.to_dict().values()
vectorizer = DV( sparse = False )
vec_x = vectorizer.fit_transform( converted_val )
numpy.savetxt('out.csv',vec_x,fmt='%10.0f',delimiter=',')
我的问题是,如何用列名保存转换后的数据?。在上面的代码中,我可以使用numpy.savetxt 函数保存数据,但这只是保存了数组并且列名丢失了。或者,是否有一种更有效的方法来执行上述操作?
【问题讨论】:
-
也许 pd.data.to_csv() 会更好。它有一个接受序列的列参数,默认为无。
标签: python numpy pandas type-conversion categorical-data