【发布时间】:2017-08-01 17:14:20
【问题描述】:
我正在构建一个脚本,以自动从我们组织的仪表板下载 Excel 文件,并将其作为 Pandas 数据框打开。我已经获得了下载文件的代码,但我发现虽然它以 .xls 扩展名保存,但它实际上是一个 HTML 文件。
这是我所拥有的:
import pandas as pd
df = pd.read_excel("report.xls")
我收到了这个错误:
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'Title\tCo'
我尝试使用 read_html,但返回“未找到表”。这是有道理的,因为没有要呈现的 html。什么给了?
【问题讨论】:
标签: python excel pandas web-scraping format