【发布时间】:2012-10-25 12:35:08
【问题描述】:
假设我有一个包含 400 列的 csv 文件。我无法将整个文件加载到 DataFrame 中(不适合内存)。但是,我真的只想要 50 列,这将适合内存。我没有看到任何内置的 Pandas 方法可以做到这一点。你有什么建议?我愿意使用PyTables 接口或pandas.io.sql。
最好的情况是这样的函数:pandas.read_csv(...., columns=['name', 'age',...,'income'])。 IE。我们传递将要加载的列名(或数字)列表。
【问题讨论】: