【发布时间】:2018-08-30 21:24:16
【问题描述】:
我在获取位于压缩文件中的 txt 文件以使用 pandas 加载/连接时遇到问题。这里有很多关于 pd.concat(zip_file.open) 的示例,但在我的情况下仍然没有任何工作,因为我有多个 zip 文件和多个 txt 文件。
例如,假设我在特定文件夹“Main”中有两个压缩文件。每个压缩文件包含五个 txt 文件。我想将所有这些 txt 文件和 pd.concat 一起阅读。在我的真实示例中,我将有几十个 zip 文件夹,每个文件夹包含五个 txt 文件。
你能帮忙吗?
文件夹和文件结构示例:
'C:/User/Example/Main'
TAG_001.zip
sample001_1.txt
sample001_2.txt
sample001_3.txt
sample001_4.txt
sample001_5.txt
TAG_002.zip
sample002_1.txt
sample002_2.txt
sample002_3.txt
sample002_4.txt
sample002_5.txt
我是这样开始的,但之后的一切都在抛出错误:
import os
import glob
import pandas as pd
import zipfile
path = 'C:/User/Example/Main'
ziplist = glob.glob(os.path.join(path, "*TAG*.zip"))
【问题讨论】:
-
Pandas 可以读取 'csv' 格式的文件吗?
-
是的。他们使用 pd.read_csv 单独阅读 pandas 的内容。