【发布时间】:2024-05-04 10:15:03
【问题描述】:
最近我不得不将 48,000 条记录导入 Google App Engine。存储的“表”是“ndb.model”类型。为了完整性,这些记录中的每一个都与“数据库”中的几个其他“表”进行检查,然后写入 (.put())。
为此,我将一个 .csv 文件上传到 Google Cloud Storage 并从那里在任务队列中处理它。这每秒处理大约 10 .csv 行,并在 41,000 条记录后出现内存不足错误。将 .csv 文件拆分为 2 组 24,000 条记录,每组可解决此问题。
所以,我的问题是:
a) 这是最好的方法吗?
b) 有没有更快的方法(下一次上传可能是大约 400,000 条记录)?和
c) 我如何克服(或停止)内存不足错误?
非常感谢, 大卫
【问题讨论】:
标签: python google-app-engine app-engine-ndb