【问题标题】:Filter and aggregation on nested data mongodb嵌套数据mongodb的过滤和聚合
【发布时间】:2020-08-19 21:25:07
【问题描述】:
{
    "_id" : ObjectId("5eb1116ed99e7c68395d479c"),
    "sheets" : [
        {
            "Sheet1" : [
                {
                    "headers" : [
                        "name,mobile"
                    ],
                    "data_count" : 10
                }
            ]
        }
    ],

    "name" : "2.csv"
},

{
    "_id" : ObjectId("5eb1116ed99e7c68395d480c"),
    "sheets" : [
        {
            "Sheet1" : [
                {
                    "headers" : [
                        "name,mobile,mobile1,mobile2,email1,email2"
                    ],
                    "data_count" : 30
                }
            ],
                        "Sheet2" : [
                {
                    "headers" : [
                        "name,mobile,mobile1"
                    ],
                    "data_count" : 20
                }
            ]
        }
    ],
    "name" : "1.csv"
}

我在一个集合中有多个文档,因此我将传递 id 和工作表名称,例如Sheet2 和我想获得所有输入 id 和工作表的数据计数总和

所以假设在上述情况下我的输入是 [{file_id:"5eb1116ed99e7c68395d479c", sheet_name:"Sheet1"}, {file_id:"5eb1116ed99e7c68395d480c", sheet_name:"Sheet2"}]

所以输出应该是 data_count 是 30

【问题讨论】:

    标签: mongodb mongoose aggregation-framework


    【解决方案1】:

    您可以使用 mongodb 聚合管道来实现这一点。如果它只包含一个包含所有工作表的对象,我不确定为什么要将工作表字段作为一个数组。我建议如下

    示例文档

    {
        _id    : ObjectId('5eb1116ed99e7c68395d480c'),
        sheets : [
            {
                name : 'Sheet 1',
                data : {
                    headers    : [ 'name,mobile,mobile1,mobile2,email1,email2' ],
                    data_count : 30
                }
            },
            {
                name : 'Sheet 2',
                data : {
                    headers    : [ 'name,mobile,mobile1' ],
                    data_count : 20
                }
            }
        ]
    }
    

    无论如何,您可以通过在文档上应用多个$match$unwind 直到将数据分成_id 字段和sheets只包含一个值的字段。然后,您可以使用$match$or 轻松匹配所需的文档。

    查询

    db.collection.aggregate([
            {
                $match : {
                    _id : {
                        $in : [ ObjectId('5eb1116ed99e7c68395d479c'), ObjectId('5eb1116ed99e7c68395d480c') ]
                    }
                }
            },
            {
                $unwind : '$sheets'
            },
            {
                $project : {
                    _id    : 1,
                    sheets : {
                        $objectToArray : '$sheets'
                    }
                }
            },
            {
                $unwind : '$sheets'
            },
            {
                $unwind : '$sheets.v'
            },
            {
                $match : {
                    $or : [
                        {
                            _id        : ObjectId('5eb1116ed99e7c68395d479c'),
                            'sheets.k' : 'Sheet1'
                        },
                        {
                            _id        : ObjectId('5eb1116ed99e7c68395d480c'),
                            'sheets.k' : 'Sheet2'
                        }
                    ]
                }
            },
            {
                $group : {
                    _id        : null,
                    data_count : {
                        $sum : '$sheets.v.data_count'
                    }
                }
            }
        ]);
    

    测试:在这里测试聚合管道:mongoplayground

    输出

    [
      {
        "_id": null,
        "data_count": 30
      }
    ]
    

    【讨论】:

      猜你喜欢
      • 2021-02-13
      • 2021-07-26
      • 1970-01-01
      • 2017-07-26
      • 2018-01-30
      • 2014-12-31
      • 2018-05-31
      • 2019-06-26
      • 2015-06-07
      相关资源
      最近更新 更多