【发布时间】:2013-06-17 08:42:05
【问题描述】:
我的公司开始使用 mongo,我们开始思考从 mongodb 中提取数据并将其发送到我们的数据仓库的最佳方法是什么。
我的问题集中在流程的提取部分。正如我所看到的,最好的方法是在构建于 mongo 之上的服务上公开 API,ETL 过程(由数据仓库中的作业调用)将执行一些特定的查询,这些查询可能会查询对于一组时间(即 - 每条记录的开始日期和结束日期)。
这听起来对吗?或者我错过了什么,或者可能有比这更好的方法?
最初我正在考虑每隔 X 持续时间执行一次 mongoexport,但根据文档,它似乎性能不太好。
提前致谢!
【问题讨论】: