【发布时间】:2020-08-14 13:30:03
【问题描述】:
我创建了一个使用 pd.read_csv 读取数据的应用程序。我们得到的一些数据集的列仅包含缺失值(空单元格)。有没有办法使用熊猫不将这些列加载到数据框中?由于数据集可能非常大,因此在预加载阶段忽略它们会更方便。
当然,我可以从 Excel 表中删除它们,但我的目标是使数据加载尽可能自动化。
【问题讨论】:
-
这些空列总是在同一个位置吗?如果是这样,您可以使用
usecols参数。 -
不,不幸的是它变化了
-
如果最近的列不为空,您也可以逐列阅读,然后
join他们。