【发布时间】:2015-01-08 17:22:41
【问题描述】:
我有两个要合并的 CSV 文件。对于熊猫,我会使用:
pd.merge(df1,df2, how='left', left_on='ST_LOGINID', right_on='LOGINID')
然而,panda 执行此操作时内存不足(“MemoryError:”),尽管在返回错误之前我的 RAM 使用量仅从 4GB 中的 1.9GB 变为 2.2GB。
因此,我正在寻找以下任一解决方案: 1) 在不将文件加载到内存的情况下执行此类合并/连接操作的一种方法 2) 一种允许 pandas 使用更多 RAM 的方法,因为似乎有足够的可用内存。
【问题讨论】: