【问题标题】:Nested groups with aggregation framework具有聚合框架的嵌套组
【发布时间】:2020-08-11 19:00:43
【问题描述】:

在我的收藏中,我有大量文档,每个文档都包含 4 种类别。

  • group
  • mainCategory
  • subCategory
  • subSubCategory

我正在寻找一种通过group$group 的方法,在group 中应该有一个mainCategory 的数组,在mainCategory 中应该有一个subCategory 的数组,并且在subCategory 应该有一个subSubCategory 的数组。结果应仅包含类别的值/名称。

预期结果:

const result = [
            {
              "group": "Teknik",
              "mainCategory": [
                {
                  "name": "Gaming",
                  "subCategory": [
                    {
                      "name": "Playstation",
                      "subSubCategory": [
                        {"name": "Games"},
                        {"name": "Accessories"},
                        {"name": "Console"}
                      ]
                    },
                    {
                      "name": "Xbox",
                      "subSubCategory": [
                        {"name": "Games"},
                        {"name": "Accessories"},
                        {"name": "Console"}
                      ]
                    }
                  ]
                }, {
                  "name": "Audio",
                  "subCategory": [
                    {
                      "name": "Headphones",
                      "subSubCategory": [
                        {"name": "Wireless"},
                        {"name": "Non Wireless"},
    
                      ]
                    },
                    {
                      "name": "Speakers",
                      "subSubCategory": [
                        {"name": ""},
                      ]
                    }
                  ]
                },
    
              ]
            }
]

我认为问题是我需要$push 父类中的每个类别并创建新的$groups?但是当添加更多$groups 时,它只是最后一个被“保存”的。其他的似乎没有被“保存”。还是我做错了什么?

示例数据和工作代码基于 prev。测试数据。

https://mongoplayground.net/p/C0-L-rGPfwy

集合中的产品结构

productName :"Horizon Zero Dawn"
group:"Teknik"
mainCategory: "Gaming"
subCategory:"Playstation"
subSubCategory: "Games"

我的聚合

const categories = await Product.aggregate([
        {$match: {group: 'Teknik'}},
        {
          $group: {
            _id: {
              group: '$group',
              mainCategory: '$mainCategory',
              subCategory: '$subCategory',
              subSubCategory: '$subSubCategory',
            }
          },
        },
        {
          $group: {
            _id: "$_id.group",
            mainCategory: {
              $push:
                {
                  name: "$_id.mainCategory",
                  subCategory: {
                    name: "$_id.subCategory",
                    subSubCategory: {
                      name: "$_id.subSubCategory"
                    }
                  }
                }
            },
          }
        },
      ]); 

有了这个,我为每个子子类别获得 1 个对象,但我希望它们在同一个对象中。

"_id": "Teknik",
    "mainCategory": [
    {
            "name": "Gaming",
            "subCategory": {
                "name": "Xbox",
                "subSubCategory": {
                    "name": "Games"
                }
            }
        },
    {
            "name": "Spel & Gaming",
            "subCategory": {
                "name": "Xbox",
                "subSubCategory": {
                    "name": "Accessories"
                }
            }
        },
]

【问题讨论】:

  • @turivishal 在帖子的顶部 const result = [...] 但现在澄清了。
  • 大约有 40 000 个文档,所以我在上面的链接中添加了一些示例数据。 mongoplayground.net/p/QjjPTuQWspt.

标签: mongodb mongoose aggregation-framework


【解决方案1】:

过程是从数组的最后一级开始准备:

  1. subSubCategory (按以下 3 级字段分组)
  1. subCategory (按 2 级以下的字段分组并推到准备好的 1 级以上)
  1. ma​​inCategory (按低于 1 级的字段分组并推至高于准备好的 2 级)
  1. (项目和展示准备级别 3)

让我们一步一步看,

  • 您的$match 条件
db.collection.aggregate([
  { $match: { group: "Teknik" } },
  • $group 只有 3 个主要字段,不要添加 subSubCategory
  • 本组准备subSubCategory数组
  {
    $group: {
      _id: {
        group: "$group",
        mainCategory: "$mainCategory",
        subCategory: "$subCategory"
      },
      subSubCategory: {
        $push: { name: "$subSubCategory" }
      }
    }
  },
  • 在上面的$group 中可能会出现重复的subSubCategory,所以这将删除重复项,如果您不想删除,则可以跳过此部分
  {
    $addFields: {
      subSubCategory: { $setUnion: ["$subSubCategory", [] ] }
    }
  },
  • 现在 $group 仅通过 2 个主要字段
  • 这将准备subCategory数组,推送我们在上面的组中准备好的namesubSubCategory数组
  {
    $group: {
      _id: {
        group: "$_id.group",
        mainCategory: "$_id.mainCategory"
      },
      subCategory: {
        $push: {
          name: "$_id.subCategory",
          subSubCategory: "$subSubCategory"
        }
      }
    }
  },
  • $group by main group 字段
  • 这将准备mainCategory数组,推送我们在上面的组中准备好的namesubCategory数组
  {
    $group: {
      _id: "$_id.group",
      mainCategory: {
        $push: {
          name: "$_id.mainCategory",
          subCategory: "$subCategory"
        }
      }
    }
  },
  • $project 删除 _id 并显示 groupmainCategory 字段
  {
    $project: {
      _id: 0,
      group: "$_id",
      mainCategory: 1
    }
  }
])

游乐场:https://mongoplayground.net/p/Uw8HmhSKqzv

【讨论】:

  • 非常感谢!使用我提供的数据按预期工作。但是,我注意到我错过了包含共享组而不是 mainCategory 的测试数据。对于那个很抱歉。我已经用更准确的测试数据和你的代码更新了 mongoplayground。如果你能给我一些如何解决这个问题的建议,我真的很感激。mongoplayground.net/p/C0-L-rGPfwy
  • 我可以看到 subSubCategory 在许多文档中都是空字符串,您对此有何期望?我可以看到那个单点,如果我失踪了,请告诉我。
  • 空字符串存在是因为使用空值感觉更简单,而不是每次都检查元素是否存在。有些产品有 subSub,有些没有。对不起,我不明白你的最后一句话?
  • 我希望组名“teknik”只有一次,然后 mainCategory 应该是一个包含所有 mainCategories(Mobil、Spel & Gaming、Ljud & Bild)的数组。如上所述,当 subSub 为空时,我不想删除主对象。
  • 我已经更新了你可以查看的答案,问题在最后一组,只需要按group字段分组,如果有任何问题,请告诉我,
猜你喜欢
  • 2020-09-01
  • 1970-01-01
  • 2020-04-23
  • 1970-01-01
  • 2014-03-04
  • 2015-06-07
  • 1970-01-01
  • 1970-01-01
  • 2017-07-26
相关资源
最近更新 更多