【发布时间】:2015-04-21 01:02:21
【问题描述】:
我有一组用户文档,其中每个用户都可以拥有一组任意属性。每个用户都与一个应用文档相关联。这是一个示例用户:
{
"appId": "XXXXXXX",
"properties": [
{ "name": "age", "value": 30 },
{ "name": "gender", "value": "female" },
{ "name": "alive", "value": true }
]
}
我希望能够根据用户属性的值来查找/计算用户。例如,找到应用 X 的所有属性 Y > 10 且 Z 等于 true 的用户。
我在这个集合db.users.ensureIndex({ "appId": 1, "properties.name": 1, "properties.value": 1}) 上有一个复合多键索引。该索引适用于单条件查询,例如:
db.users.find({
appId: 'XXXXXX',
properties: {
$elemMatch: {
name: 'age',
value: {
$gt: 10
}
}
}
})
上述查询在 explain() 输出表明正在扫描整个索引以完成查询("nscanned" : 2752228)。
查询
db.users.find({
appId: 'XXXXXX',
properties: {
$all: [
{
$elemMatch: {
name: 'age',
value: {
$gt: 10
}
}
},
{
$elemMatch: {
name: 'alive',
value: true
}
}
]
}
})
解释
{
"cursor" : "BtreeCursor appId_1_properties.name_1_properties.value_1",
"isMultiKey" : true,
"n" : 256,
"nscannedObjects" : 1000000,
"nscanned" : 2752228,
"nscannedObjectsAllPlans" : 1018802,
"nscannedAllPlans" : 2771030,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 21648,
"nChunkSkips" : 0,
"millis" : 7425,
"indexBounds" : {
"appId" : [
[
"XXXXX",
"XXXXX"
]
],
"properties.name" : [
[
{
"$minElement" : 1
},
{
"$maxElement" : 1
}
]
],
"properties.value" : [
[
{
"$minElement" : 1
},
{
"$maxElement" : 1
}
]
]
},
"filterSet" : false
}
我认为这是因为 Mongo 无法创建合适的边界,因为我正在寻找布尔值和整数值。
我的问题是:有没有更好的方法来构建我的数据,或者修改我的查询以提高性能并更好地利用我的索引?是否可以指示 mongo 分别处理每个条件,生成适当的边界,然后执行结果的交集,而不是扫描所有文档?还是 mongo 不适合这种类型的用例?
【问题讨论】:
-
您使用的是 2.6 版本的 MongoDB,对吧?我无法重现这一点 - 在 3.0-rc8 中,查询速度很快,即它不扫描对象。
-
@mnemosyn 是的,我使用的是 v2.6.7
-
嗯,也许 3.0-rc8 可以解决你的问题?至少如果您愿意在生产环境中使用候选版本...
-
不幸的是,在 3.0 正式发布之前,我认为这不是一个选择,因为我们的数据库托管在云中
-
是的,对于
标签: performance mongodb indexing