【发布时间】:2019-08-01 11:49:44
【问题描述】:
我正在尝试两行不同的代码,它们都涉及计算 df 行与 500k 行的组合。
我认为在大量组合中,内核一直在死亡。有没有办法解决这个问题?
崩溃的两行代码都是
pd.merge(df.assign(key=0), df.assign(key=0), on='key').drop('key', axis=1)
和
index_comb = list(combinations(df.index, 2))
两者都是实现相同所需 df 的不同方法,但内核都失败了。
不胜感激:/
更新:我尝试在终端中使用代码,但它给了我一个 kill 9 的错误:它也在终端中使用了太多内存?
【问题讨论】:
标签: python python-3.x dataframe jupyter-notebook combinations