【发布时间】:2021-07-01 21:58:53
【问题描述】:
我正在尝试将 .xlsx 文件读入数据帧。 在 Excel 中打开的 .xlsx 如下所示:
| Heading 1 | Heading 2 | Heading 3 |
|---|---|---|
| soda | 12 | 4 |
| pop | 12 | 2 |
| cola | 12 | 3 |
但是我读到的数据框是:
df = pd.read_excel("fileName.xlsx", engine='openpyxl')
看起来像这样:
| Heading 1 | Heading 2 | Heading 3 |
|---|---|---|
| soda | 0 | 4 |
| pop | 0 | 2 |
| cola | 0 | 3 |
有谁知道为什么第二个标题中的所有值都替换为 0?或者有什么办法可以绕过它?我不确定是否考虑到标准 read_csv 不再支持 .xlsx 所以我一直在使用 Openpyxl 版本。提前致谢!
编辑:所以 xlrd 也不再支持 .xlsx(仅 .xls),所以我安装了旧版本的 xlrd,但使用旧版本的 xlrd 得到的结果与使用当前版本的 xlrd 相同打开pyxl。还在寻求帮助...
我的意思是用 read_excel 代替 read_csv
【问题讨论】:
-
不指定
engine参数就试试吧。 -
尝试在 csv 中转换您的 excel 表格,然后使用 read_csv 函数或安装 xlrd 这是读取 excel 文件的默认引擎
-
当我尝试使用 xlrd 或不使用引擎参数时,我收到错误 xlrd.biffh.XLRDError: Excel xlsx file;不支持
标签: python excel pandas dataframe openpyxl