【发布时间】:2016-11-10 13:01:07
【问题描述】:
我有一个包含 .csv 文件的文件夹,其中包含以下格式的时间序列:
1 0.950861
2 2.34248
3 2.56038
4 3.46226
...
我通过遍历包含文件的文件夹并将每个文本文件传递给字典来访问这些文本文件:
data_dict = {textfile: pd.read_csv(textfile, header=3, delim_whitespace=True, index_col=0) for textfile in textfiles}
我想合并包含彼此相邻的数据的列,并以字典键作为索引(文本文件的路径名)。它们都具有相同的行号。
到目前为止,我尝试将字典传递给 pd.Dataframe,如下所示:
df = pd.DataFrame.from_dict(data_dict, orient='index')
其实orientation需要是默认的'columns',但是会报错: 值错误:如果使用所有标量值,则必须传递索引
如果我这样做,我会得到错误的结果: Excel_Output
这就是我将框架传递给 Excel 的方式:
writer = pd.ExcelWriter("output.xls")
df.to_excel(writer,'data', index_label = 'data', merge_cells =False)
writer.save()
我认为错误一定是在将字典传递给数据框时。 我试过 pd.concat/merge/append 但没有返回正确的结果。
提前致谢!
【问题讨论】: