【问题标题】:MongoDB: Counting duplicate fields, mapReduce vs python loopsMongoDB:计算重复字段,mapReduce 与 python 循环
【发布时间】:2013-05-30 17:22:09
【问题描述】:

我有一个集合,我想在其中查找给定字段的所有重复项。从这里的 Mongo 文档和其他答案来看,大多数人似乎建议使用 mapReduce。我想知道从 python 中迭代游标而不是使用 map reduce 有什么缺点。

似乎 mapreduce 也必须遍历对象。

在此处添加解决方案,这样可能会对某人有所帮助。

我运行了以下查询以获取不止一次出现的所有条形码的列表。 $group 管道统计出现次数,$match 过滤count 大于1 的那些。

db.sandbox.aggregate([
                      {$group: {_id: '$barcode',
                                count: {$sum: 1}
                               }
                      },
                      {$match: {count: {$gt:1} } }
                     ])

【问题讨论】:

  • 你可以为此做聚合。

标签: mongodb mapreduce pymongo


【解决方案1】:

aggregation framework 将帮助您查找重复项。它比获取记录和循环更好。

【讨论】:

  • 甚至不知道什么是聚合。但工作完美。谢谢。
猜你喜欢
  • 1970-01-01
  • 2018-06-29
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-11-23
  • 2012-10-18
  • 2016-05-26
  • 2014-11-08
相关资源
最近更新 更多