【发布时间】:2014-02-16 23:55:16
【问题描述】:
我有一个系统将日志写入 mongodb(每天大约 1kk 个日志)。我需要每周计算这些日志的一些统计数据。由于计算非常消耗处理器和内存,我想将我正在工作的集合复制到强大的异地机器。如何在不复制所有内容的情况下使异地收藏保持最新?我通过在其元素中存储统计信息来修改场外收集,即添加字段{"alogirthm_1": "passed"} 或{"stat1": 3.1415}。复制适合我的用例还是我应该研究其他替代方案?
【问题讨论】:
-
每天 1kk 个日志是多少?每天 100 万条日志行?
-
你将如何处理你的日志数据? Map/Reduce 或者您有计算应用程序?
-
@Stennie,是的,完全正确。
-
@yaoxing 我已经申请了计算。
-
@Moonwalker 那么我的答案的解决方案 1 将适用。您需要阅读有关聚合框架的文档和您的语言的 API 文档。这会给您的 MongoDB 服务器带来压力。而如果你通过解决方案 3,压力会在你的应用服务器上,并且逻辑会更复杂。
标签: mongodb storage replication database