【发布时间】:2018-11-07 09:36:23
【问题描述】:
我正在尝试读取 pandas 数据框中的 WGIData.csv 文件。 WGIData.csv 存在于我从该 url 下载的 zip 文件中
http://databank.worldbank.org/data/download/WGI_csv.zip
但是当我尝试阅读时,它会抛出错误 BadZipFile: File is not a zip file
这是我的python代码
import pandas as pd
from urllib.request import urlopen
from zipfile import ZipFile
class Get_Data():
def Return_csv_from_zip(self, url):
self.zip = urlopen(url)
self.myzip = ZipFile(self.zip)
self.myzip = self.zip.extractall(self.myzip)
self.file = pd.read_csv(self.myzip)
self.zip.close()
return self.file
url = 'http://databank.worldbank.org/data/download/WGI_csv.zip'
data = Get_Data()
df = data.Return_csv_from_zip(url)
【问题讨论】:
-
您的 zip 有两个文件:
['WGIData.csv', 'WGISeries.csv']这可能是问题所在。 -
这个 zip 文件还不错,我用 winrar @AChampion 解压了
-
那我该怎么办?@coldspeed
-
我只想阅读 WGIData.csv
-
这样的事情可能会有所帮助:stackoverflow.com/q/21075999/4909087
标签: python pandas unzip zipfile