【发布时间】:2012-02-07 19:56:24
【问题描述】:
我希望得到您对以下 Python 项目最佳设计方法的建议。
我正在构建一个分为两部分的 Web 服务系统:
- 这部分从第 3 方 API 获取实时数据并将数据放入数据库中。
- 这部分公开了一个 json API 来访问 1) 中提到的 DB 中的数据。
一些背景信息 - 2) 在 django 上运行,并通过视图方法公开 API。它使用 SQLAlchemy 而不是 django ORM。
我的问题是:
- 考虑到它们都访问同一个 MySQL DB,1) 和 2) 是否应该在同一台机器上运行?
- 1)应该运行什么?我正在考虑只使用也使用 SQLAlchemy 的 Python 脚本运行 cron 作业。这是因为我认为这里不需要整个 Web 框架,尤其是因为它需要超快地工作。这是最好的方法吗?
- 数据大小 - 1) 每 1 分钟获取大约 60,000 个条目并将它们放入数据库中(一个条目包含大约 12 个浮点值和一些日期和整数)。在这里处理不断增长的数据量的最佳方法是什么?你会拆分数据库吗?如果是这样,进入什么?
谢谢!
【问题讨论】:
-
由于我对 SQLAlchemy 等没有任何经验。我只是对数据大小问题发表评论:您可以根据数据收集的时间使用某种分片或使用循环算法。详情请见http://en.wikipedia.org/wiki/RRDtool。