【发布时间】:2015-10-22 13:43:50
【问题描述】:
我在一个文件夹中有多个具有类似值的 CSV 文件:
GroupID.csv 是文件名。有多个这样的文件,但值范围是在同一个 XML 文件中定义的。我正在尝试将它们分组 我该怎么做?
更新1: 基于 BobHaffner 的 cmets,我已经做到了
import pandas as pd
import glob path =r'path/to/files'
allFiles = glob.glob(path + "/*.csv")
frame = pd.DataFrame()
list_ = []
for file_ in allFiles:
df = pd.read_csv(file_,index_col=None, header=None)
df['file'] = os.path.basename('path/to/files/'+file_)
list_.append(df)
frame = pd.concat(list_)
print frame
得到这样的东西:
我需要根据 XML 文件中的 bin 对值进行分组。我真的很感激任何帮助。
【问题讨论】:
-
这里有几个问题。我建议尝试将 csvs 放入一个数据框中作为第一步。查看 glob 模块和 pandas read_csv() 和 concat()
-
@BobHaffner 我可以做到。在连接时,它会丢失文件名。不会吗?
-
您可以在每个数据框中使用文件名创建一个附加字段。那会起作用的,对吧?
-
然后将它们连接起来
-
是的,我会这样做的。 @BobHaffner