【发布时间】:2020-07-07 19:42:50
【问题描述】:
我知道用 pandas 读取 excel 表:
import pandas as pd
table = pd.read_excel(io)
加载数据后,如果要获取表头:
table.columns
这种方法是可行的,但是有时候我只想直接获取excel表的表头,尤其是excel表体大的时候,把数据表加载到内存中会很耗时&这也是不必要的,有时甚至会直接溢出并卡住。看官方文档,好像可以用nrows参数指定只能读取Excel的特定行,也就是说我可以用它只读取第一行表头:
header = pd.read_excel(io, nrows = 0)
但是我发现pandas也无法阻止pandas读取整个excel数据,而且还是会消耗大量的时间和内存。您在处理这个问题方面有很好的经验吗?
【问题讨论】:
-
这能回答你的问题吗? Reading column names alone in a csv file
-
不,xlsx 文件不同
-
所以只有文件扩展名发生变化,在更改文件扩展名后尝试该代码。
-
看看这个库,看看它是否有帮助pyexcel
标签: python excel pandas dataframe openpyxl