【发布时间】:2012-08-14 16:41:13
【问题描述】:
Map Reduce 在 Mongo 中很慢。这是给定的。所以,我想知道是否可以接收 map reduce 进度通知。
谢谢。
【问题讨论】:
-
解决方法是不使用map-reduce。 MongoDB 中的 MR 设计糟糕,实现被破坏。如果你真的需要一个可靠的 MR 实现:将 MongoDB 与 Hadoop 一起使用 - 否则不要使用它。
-
感谢您的建议。我正在使用 Windows 7 进行开发。这是否意味着我必须拥有 Cygwin + OpenSSH 才能运行 Hadoop? Hadoop 是 Mongo MR 引擎唯一可行的替代方案吗?
-
Hadoop 对您的应用程序来说是一个额外的复杂层,它需要自己的服务器、与 Mongo 的连接器(从读取用户组来看,它有时可能非常狡猾)并且实际上并不像内置先生。你基本上是在寻找一个全新的分布式 MR 引擎,它可能是一个简单的 MR,只是运行大量数据。
-
事实上,与@Maulwurfn 相矛盾的是,我认为正确的答案是以不需要 MR 的方式构建数据和应用程序,或者尝试新的聚合框架或使用为 MongoHQ 和 MongoLabs 等外部 MR 提供的预构建服务。没有必要为 MR 运行你自己的 hadoop 集群……这太过分了