【问题标题】:Update MongoDB field using value of another field使用另一个字段的值更新 MongoDB 字段
【发布时间】:2011-04-27 20:40:31
【问题描述】:

在 MongoDB 中,是否可以使用来自另一个字段的值来更新一个字段的值?等效的 SQL 类似于:

UPDATE Person SET Name = FirstName + ' ' + LastName

MongoDB 的伪代码是:

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );

【问题讨论】:

    标签: mongodb mongodb-query aggregation-framework


    【解决方案1】:

    最好的方法是在 4.2+ 版本中,它允许在 update 文档和 updateOneupdateManyupdate 收集方法中使用聚合管道。请注意,后者已在大多数(如果不是所有)语言驱动程序中被弃用。

    MongoDB 4.2+

    4.2 版还引入了$set 管道阶段运算符,它是$addFields 的别名。我将在这里使用$set,因为它映射我们正在努力实现的目标。

    db.collection.<update method>(
        {},
        [
            {"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
        ]
    )
    

    请注意,定义聚合管道而不是普通更新文档的方法的第二个参数中的方括号。使用普通文档将无法正常工作。

    MongoDB 3.4+

    在 3.4+ 中,您可以使用 $addFields$out 聚合管道运算符。

    db.collection.aggregate(
        [
            { "$addFields": { 
                "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
            }},
            { "$out": "collection" }
        ]
    )
    

    请注意,此不会更新您的集合,而是替换现有集合或创建一个新集合。此外,对于需要 "typecasting" 的更新操作,您将需要客户端处理, 并且根据操作的不同,您可能需要使用find() 方法而不是.aggreate() 方法。

    MongoDB 3.2 和 3.0

    我们这样做的方式是$projecting 我们的文档并使用$concat 字符串聚合运算符返回连接的字符串。 然后,您从那里迭代 光标 并使用 $set 更新运算符使用 批量操作 将新字段添加到您的文档中以获得最大效率。

    聚合查询:

    var cursor = db.collection.aggregate([ 
        { "$project":  { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }}
    ])
    

    MongoDB 3.2 或更新版本

    由此,您需要使用bulkWrite 方法。

    var requests = [];
    cursor.forEach(document => { 
        requests.push( { 
            'updateOne': {
                'filter': { '_id': document._id },
                'update': { '$set': { 'name': document.name } }
            }
        });
        if (requests.length === 500) {
            //Execute per 500 operations and re-init
            db.collection.bulkWrite(requests);
            requests = [];
        }
    });
    
    if(requests.length > 0) {
         db.collection.bulkWrite(requests);
    }
    

    MongoDB 2.6 和 3.0

    从此版本开始,您需要使用现已弃用的Bulk API 及其associated methods

    var bulk = db.collection.initializeUnorderedBulkOp();
    var count = 0;
    
    cursor.snapshot().forEach(function(document) { 
        bulk.find({ '_id': document._id }).updateOne( {
            '$set': { 'name': document.name }
        });
        count++;
        if(count%500 === 0) {
            // Excecute per 500 operations and re-init
            bulk.execute();
            bulk = db.collection.initializeUnorderedBulkOp();
        }
    })
    
    // clean up queues
    if(count > 0) {
        bulk.execute();
    }
    

    MongoDB 2.4

    cursor["result"].forEach(function(document) {
        db.collection.update(
            { "_id": document._id }, 
            { "$set": { "name": document.name } }
        );
    })
    

    【讨论】:

    • 4.2+ 不起作用。 MongoError: 'name.$concat' 中的美元 ($) 前缀字段 '$concat' 对存储无效。
    • @JoshWoodcock,我认为您正在运行的查询中有错字。我建议你仔细检查。
    • 对于那些遇到@JoshWoodcock 描述的同样问题的人:请注意,4.2+ 的答案描述了一个聚合管道,所以不要错过方括号 在第二个参数中!
    • 是否可以做与此解决方案相同的事情,但不是将两个字符串连接在一起,而是将两个数字相加?
    • 在变成笑话之前他们要改变多少次?
    【解决方案2】:

    您应该遍历。对于您的具体情况:

    db.person.find().snapshot().forEach(
        function (elem) {
            db.person.update(
                {
                    _id: elem._id
                },
                {
                    $set: {
                        name: elem.firstname + ' ' + elem.lastname
                    }
                }
            );
        }
    );
    

    【讨论】:

    • 如果其他用户更改了您的 find() 和 save() 之间的文档会怎样?
    • 是的,但是字段之间的复制不应该要求事务是原子的。
    • 请注意save() 完全替换了文档,这一点很重要。应该改用update()
    • db.person.update( { _id: elem._id }, { $set: { name: elem.firstname + ' ' + elem.lastname } } );怎么样
    • 我创建了一个名为create_guid 的函数,当以这种方式使用forEach 进行迭代时,它只为每个文档生成一个唯一的guid(即在update 语句中简单地使用create_guidmutli=true导致为所有文档生成相同的 guid)。这个答案对我来说非常有效。 +1
    【解决方案3】:

    显然,自 MongoDB 3.4 起就有一种方法可以有效地做到这一点,请参阅 styvane's answer


    以下已过时的答案

    您不能在更新中引用文档本身(目前)。您需要遍历文档并使用函数更新每个文档。有关示例,请参阅 this answer,或在服务器端查看 this one eval()

    【讨论】:

    • 今天仍然有效吗?
    • @ChristianEngel:看起来是这样。我无法在 MongoDB 文档中找到在 update 操作中提到对当前文档的引用的任何内容。 This related feature request 也仍未解决。
    • 2017年4月还有效吗?还是已经有新功能可以做到这一点?
    • @Kim 看起来它仍然有效。此外,@niels-van-der-rest 在 2013 年指出的 feature request 仍在 OPEN 中。
    • 这不再是一个有效的答案,看看@styvane 的答案
    【解决方案4】:

    对于活跃度高的数据库,您可能会遇到更新影响主动更改记录的问题,因此我建议使用 snapshot()

    db.person.find().snapshot().forEach( function (hombre) {
        hombre.name = hombre.firstName + ' ' + hombre.lastName; 
        db.person.save(hombre); 
    });
    

    http://docs.mongodb.org/manual/reference/method/cursor.snapshot/

    【讨论】:

    • 如果另一个用户在 find() 和 save() 之间编辑了这个人会发生什么?我有一个案例,可以对同一个对象进行多次调用,根据它们的当前值更改它们。第二个用户必须等待阅读,直到第一个用户完成保存。这能做到吗?
    • 关于snapshot()Deprecated in the mongo Shell since v3.2. Starting in v3.2, the $snapshot operator is deprecated in the mongo shell. In the mongo shell, use cursor.snapshot() instead.link
    【解决方案5】:

    Mongo 4.2开始,db.collection.update()可以接受一个聚合管道,最后允许基于另一个字段更新/创建一个字段:

    // { firstName: "Hello", lastName: "World" }
    db.collection.update(
      {},
      [{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
      { multi: true }
    )
    // { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
    
    • 第一部分{} 是匹配查询,过滤要更新的文档(在我们的例子中是所有文档)。

    • 第二部分[{ $set: { name: { ... } }] 是更新聚合管道(注意方括号表示使用聚合管道)。 $set 是一个新的聚合运算符,别名为$addFields

    • 不要忘记{ multi: true },否则只会更新第一个匹配的文档。

    【讨论】:

    • 为我工作。在没有连接的情况下将一个字段分配给另一个字段并且它有效。谢谢!
    • 你的第一点和你的第三点有什么区别? {} 表示所有文档,那么为什么 { multi: true }
    • @Coder17 第一部分{} 是一个过滤部分:例如,您可能想要更新doc1doc2,而不是doc3。如果没有第三部分,默认情况下,更新将仅应用于 1 个文档,例如 doc1,并且不会更新 doc2。注意,你也可以使用db.collection.updateMany去掉第三个参数。
    【解决方案6】:

    关于这个answer,根据这个update,快照功能在3.6版本中被弃用。所以,在 3.6 及以上版本,可以这样操作:

    db.person.find().forEach(
        function (elem) {
            db.person.update(
                {
                    _id: elem._id
                },
                {
                    $set: {
                        name: elem.firstname + ' ' + elem.lastname
                    }
                }
            );
        }
    );
    

    【讨论】:

      【解决方案7】:

      我尝试了上述解决方案,但发现它不适用于大量数据。然后我发现了流功能:

      MongoClient.connect("...", function(err, db){
          var c = db.collection('yourCollection');
          var s = c.find({/* your query */}).stream();
          s.on('data', function(doc){
              c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
          });
          s.on('end', function(){
              // stream can end before all your updates do if you have a lot
          })
      })
      

      【讨论】:

      • 这有什么不同?更新活动会扼杀蒸汽吗?你有什么参考吗? Mongo 文档很差。
      【解决方案8】:

      update() 方法将聚合管道作为参数,如

      db.collection_name.update(
        {
          // Query
        },
        [
          // Aggregation pipeline
          { "$set": { "id": "$_id" } }
        ],
        {
          // Options
          "multi": true // false when a single doc has to be updated
        }
      )
      

      可以使用聚合管道使用现有值设置或取消设置字段。

      注意:使用$和字段名来指定需要读取的字段。

      【讨论】:

      【解决方案9】:

      这是我们想出的将一个字段复制到另一个字段以获取约 150_000 条记录的方法。花费了大约 6 分钟,但与实例化和迭代相同数量的 ruby​​ 对象相比,它所占用的资源要少得多。

      js_query = %({
        $or : [
          {
            'settings.mobile_notifications' : { $exists : false },
            'settings.mobile_admin_notifications' : { $exists : false }
          }
        ]
      })
      
      js_for_each = %(function(user) {
        if (!user.settings.hasOwnProperty('mobile_notifications')) {
          user.settings.mobile_notifications = user.settings.email_notifications;
        }
        if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
          user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
        }
        db.users.save(user);
      })
      
      js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
      Mongoid::Sessions.default.command('$eval' => js)
      

      【讨论】:

        【解决方案10】:

        使用 MongoDB 4.2+ 版,更新更加灵活,因为它允许在其 updateupdateOneupdateMany 中使用聚合管道。您现在可以使用聚合运算符转换您的文档,然后进行更新,而无需明确声明 $set 命令(而不是我们使用 $replaceRoot: {newRoot: "$$ROOT"}

        这里我们使用聚合查询从 MongoDB 的 ObjectID "_id" 字段中提取时间戳并更新文档(我不是 SQL 专家,但我认为 SQL 不提供任何自动生成的带有时间戳的 ObjectID,你必须自动创建该日期)

        var collection = "person"
        
        agg_query = [
            {
                "$addFields" : {
                    "_last_updated" : {
                        "$toDate" : "$_id"
                    }
                }
            },
            {
                $replaceRoot: {
                    newRoot: "$$ROOT"
                } 
            }
        ]
        
        db.getCollection(collection).updateMany({}, agg_query, {upsert: true})
        

        【讨论】:

        • 你不需要{ $replaceRoot: { newRoot: "$$ROOT" } };这意味着自行替换文档,这是没有意义的。如果您将$addFields 替换为其别名$setupdateManyupdate 的别名之一),那么您将得到与上述this one 完全相同的答案。
        • 感谢@Xavier Guihot 的评论。之所以使用$replaceRoot是因为我们需要使用$toDate查询,而$set并没有为我们提供使用$toDate的方法
        【解决方案11】:

        (我会将此作为评论发布,但不能)

        对于任何来到这里尝试使用 c# 驱动程序使用文档中的另一个字段更新一个字段的人... 我无法弄清楚如何使用任何 UpdateXXX 方法及其相关的重载,因为它们将 UpdateDefinition 作为参数。

        // we want to set Prop1 to Prop2
        class Foo { public string Prop1 { get; set; } public string Prop2 { get; set;} } 
        
        void Test()
        { 
             var update = new UpdateDefinitionBuilder<Foo>();
             update.Set(x => x.Prop1, <new value; no way to get a hold of the object that I can find>)
        }
        

        作为一种解决方法,我发现您可以在 IMongoDatabase (https://docs.mongodb.com/manual/reference/command/update/#dbcmd.update) 上使用 RunCommand 方法。

        var command = new BsonDocument
                {
                    { "update", "CollectionToUpdate" },
                    { "updates", new BsonArray 
                         { 
                               new BsonDocument
                               {
                                    // Any filter; here the check is if Prop1 does not exist
                                    { "q", new BsonDocument{ ["Prop1"] = new BsonDocument("$exists", false) }}, 
                                    // set it to the value of Prop2
                                    { "u", new BsonArray { new BsonDocument { ["$set"] = new BsonDocument("Prop1", "$Prop2") }}},
                                    { "multi", true }
                               }
                         }
                    }
                };
        
         database.RunCommand<BsonDocument>(command);
        

        【讨论】:

          猜你喜欢
          • 2020-06-12
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多