您要决定的第一件事就是您将使用哪种树。
要考虑的最重要的事情是您的数据和访问模式。您已经说过,您所有工作的 90% 都将是查询,并且听起来(电子商务)更新只会由管理员运行,而且很可能很少。
因此,您需要一个模式,让您能够通过路径快速查询孩子,即:体育 -> 篮球 -> 男子、体育 -> 网球 -> 女子,并且不需要真正扩展到更新。
正如您正确指出的那样,MongoDB 确实为此提供了一个很好的文档页面:https://docs.mongodb.com/manual/applications/data-models-tree-structures/ 其中 10gen 实际上为树声明了不同的模型和模式方法,并描述了它们的主要起伏。
如果您希望轻松查询,应该引起注意的是具体化路径:https://docs.mongodb.com/manual/tutorial/model-tree-structures-with-materialized-paths/
这是一种非常有趣的构建树的方法,因为要在上面给出的示例中查询“网球”中的“女性”,您可以简单地执行一个预先固定的正则表达式(可以使用索引:http://docs.mongodb.org/manual/reference/operator/regex/)像这样:
db.products.find({category: /^Sports,Tennis,Womens[,]/})
查找树的特定路径下列出的所有产品。
不幸的是,这种模型在更新方面确实很糟糕,如果您移动一个类别或更改其名称,您必须更新所有产品,并且一个类别下可能有数千种产品。
更好的方法是在产品上放置cat_id,然后使用架构将类别分成单独的集合:
{
_id: ObjectId(),
name: 'Women\'s',
path: 'Sports,Tennis,Womens',
normed_name: 'all_special_chars_and_spaces_and_case_senstive_letters_taken_out_like_this'
}
所以现在您的查询只涉及类别集合,这应该会使它们更小且性能更高。例外情况是,当您删除一个类别时,产品仍需要触摸。
所以一个把“网球”改成“羽毛球”的例子:
db.categories.update({path:/^Sports,Tennis[,]/}).forEach(function(doc){
doc.path = doc.path.replace(/,Tennis/, ",Badmin");
db.categories.save(doc);
});
不幸的是,MongoDB 目前没有提供查询内文档反射,因此您必须将它们拉出客户端,这有点烦人,但希望它不会导致带回太多类别。
这基本上就是它真正的工作方式。更新有点痛苦,但我相信能够使用索引在任何路径上即时查询的能力更适合您的场景。
当然,额外的好处是这个模式与嵌套集合模型兼容:http://en.wikipedia.org/wiki/Nested_set_model 我一次又一次地发现它对于电子商务网站来说非常棒,例如,网球可能在两个“运动”下和“休闲”,并且您需要多个路径,具体取决于用户来自哪里。
物化路径的架构很容易支持这一点,只需添加另一个path,就这么简单。
希望它是有道理的,那里很长。