【发布时间】:2014-01-21 09:08:20
【问题描述】:
我想将目录中的几个 excel 文件读入 pandas 并将它们连接到一个大数据框中。我一直无法弄清楚。我需要一些有关 for 循环和构建串联数据框的帮助: 这是我到目前为止所拥有的:
import sys
import csv
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files\excelfiles'
filenames = glob.glob(path + "/*.xlsx")
dfs = []
for df in dfs:
xl_file = pd.ExcelFile(filenames)
df=xl_file.parse('Sheet1')
dfs.concat(df, ignore_index=True)
【问题讨论】:
-
您在另一个问题中的代码很好,只需将
read_csv替换为read_excel。 -
您的代码在这里并不正确(它在另一个问题中)。您不能循环遍历刚刚创建的空列表
dfs,因此循环遍历文件名,然后循环中的dfs.append(df),然后是pd.concat(dfs, ignore_index=True) -
你能编辑我的代码吗,因为我是 python 的初学者
-
请看看你的其他问题。
-
好的,谢谢,现在可以了!!!
标签: python excel pandas concatenation