【发布时间】:2018-09-26 05:58:44
【问题描述】:
我正在使用具有大量重复键的 MongoDB 集合。我定期进行聚合查询以找出这些重复项是什么,以便我可以深入研究并找出它们的不同之处。
不幸的是,数据库很大,而且经常是故意重复的。我想做的是找到具有重复项的 count 键,而不是打印具有数千行输出的结果。这可能吗?
(旁注:我通过 shell 进行所有查询,因此不需要外部工具或大量代码的解决方案将是首选,但我知道这并不总是可行的。)
示例记录:
{ "_id" : 1, "type" : "example", "key" : "111111", "value" : "abc" }
{ "_id" : 2, "type" : "example", "key" : "222222", "value" : "def" }
{ "_id" : 3, "type" : "example", "key" : "222222", "value" : "ghi" }
{ "_id" : 4, "type" : "example", "key" : "333333", "value" : "jkl" }
{ "_id" : 5, "type" : "example", "key" : "333333", "value" : "mno" }
{ "_id" : 6, "type" : "example", "key" : "333333", "value" : "pqr" }
{ "_id" : 7, "type" : "example", "key" : "444444", "value" : "stu" }
{ "_id" : 8, "type" : "example", "key" : "444444", "value" : "vwx" }
{ "_id" : 9, "type" : "example", "key" : "444444", "value" : "yz1" }
{ "_id" : 10, "type" : "example", "key" : "444444", "value" : "234" }
这是我一直用来根据key 查找重复项的查询:
db.collection.aggregate([
{
$match: {
type: "example"
}
},
{
$group: {
_id: "$key",
count: {
$sum: 1
}
}
},
{
$match: {
count: {
$gt: 1
}
}
}
])
这给了我一个输出:
{
"_id": "222222",
"count": 2
},
{
"_id": "333333",
"count": 3
},
{
"_id": "444444",
"count": 4
}
我想要得到的结果:
3
【问题讨论】:
-
在 $match 之后添加
{$count:"count"}。 -
@Veeram 谢谢!
标签: mongodb mongodb-query aggregation-framework