【发布时间】:2014-01-12 19:42:49
【问题描述】:
我有一个由列表列表组成的 Numpy 数组,表示一个带有行标签和列名的二维数组,如下所示:
data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
我希望生成的 DataFrame 将 Row1 和 Row2 作为索引值,并将 Col1、Col2 作为标头值
我可以指定索引如下:
df = pd.DataFrame(data,index=data[:,0]),
但是我不确定如何最好地分配列标题。
【问题讨论】:
-
@behzad.nouri 的回答是正确的,但我认为您应该考虑是否不能以其他形式获得初始数据。因为现在,您的值将是字符串而不是整数(因为 numpy 数组混合了整数和字符串,所以所有都被转换为字符串,因为 numpy 数组必须是同质的)。