【发布时间】:2012-03-14 19:48:51
【问题描述】:
在开发了几个 GAE 应用程序(其中一些正在用于生产)之后,我得出的结论是,在这个平台上,备份生产数据的速度足够慢,而且成本足够高,足以让我们过渡到其他基于云的应用程序技术栈。
在我们的一个生产应用中,我们有大约一百万个实体,每个实体的平均大小为 1KB。所以数据的总大小大约是 GB,这应该不是什么大问题,对吧?以下是使用默认选项从应用引擎获取实体后,bulkloader 工具的输出:
[INFO] 948212 个实体(608342497 字节)在 47722.7 中传输 秒
差不多 13 个小时。因此,如果我们想为生产数据设置每小时备份系统,使用当前的 GAE 工具集是不可能的。
成本是另一回事。我尝试使用数据存储管理员将实体复制到另一个我认为可以用于备份的应用程序。我首先将预算设置为每天 2 美元,这很快在大约 5000 个实体中用完,然后我将预算增加到每天 10 美元,但在没有接近复制百万个实体的情况下再次用完。
我显然不打算每次需要备份我的 1 GB 数据时花费 100 美元,我也不想等待数小时(甚至数天)来备份我的数据。因此,要么我什么都不知道,要么 Google App Engine 目前只是一种不切实际的方式来编写可以轻松备份和恢复的有意义大小的可扩展生产质量应用程序。
是否有一种快速且经济高效的方式从 GAE 应用程序备份您的数据?
【问题讨论】:
标签: python google-app-engine backup restore