【问题标题】:PyMongo - Setting all values in an attribute to lowercase [duplicate]PyMongo - 将属性中的所有值设置为小写[重复]
【发布时间】:2018-06-10 09:24:00
【问题描述】:

我正在清理一个数据集,并且有一个字段性别。在该字段中,有男性、男性和男性等条目。为了解决这个问题,我正在尝试使用 pymongo 更新我的 MongoDB 数据库。

在数据库中,Gender属性为Gender(前面是大写的G)

我的代码目前如下所示:

import pymongo
from pymongo import MongoClient


db_info = {
    'db_name': 'MentalHealth',
    'collection_name': 'MentalHealth',
}

if __name__ == "__main__":

    mongo_client = MongoClient()
    mongo_db = mongo_client[db_info['db_name']]
    mongo_collection = mongo_db[db_info['collection_name']]

    #normalize to lowercase
    mongo_collection.aggregate([{ '$project': { 'Gender':{ '$toLower':"$Gender"}}}])

代码运行没有问题,但数据库没有更新,我不确定代码有什么错误。任何帮助将不胜感激。谢谢!!!

【问题讨论】:

  • 您正在执行aggregate,它将返回所有Gender 字段转换为小写。更新记录使用update
  • 你快到了。你有很多选择。查看我对可能重复的回答
  • @sstyvane 这是错误的重复。 OP 没有使用另一个字段的值更新Gender 字段,而是使用相同的字段。
  • 另一个字段或相同字段,过程仍然相同,这就是为什么我们说“可能重复”如果不是这种情况我会回答,因为除了这个@,这里的答案都没有用987654322@ 提到了$out 管道阶段运算符。 @GarbageCollector
  • 你错过了这里的重点。答案不仅适用于 OP。我提出了issue once on meta 并给出了教坏习惯的答案,请参阅comment,但我想您不想看到我指出的内容,那是您的选择@GarbageCollector

标签: python mongodb pymongo


【解决方案1】:

Mongodb 聚合操作处理数据记录并返回计算结果。它无法更新任何集合。您可以像这样更新相同的内容

db.mongo_collection.find({}).forEach(function(doc) {
    db.mongo_collection.update(
        { "_id": doc._id },
        { "$set": { "Gender": doc.Gender.toUpperCase() } }
    );
});

【讨论】:

  • 这个问题被标记为pymongo 但是你的解决方案是使用js
  • 感谢您的帮助。正如 Garbage Collector 所说,这不是在 python 中,而是在 js 中,但我感谢您的帮助!
【解决方案2】:

您使用的聚合框架仅执行查询。要实际执行写入,您需要使用$out 阶段将结果转储到集合中。 如果您选择现有的集合,则该集合将按照https://docs.mongodb.com/manual/reference/operator/aggregation/out/#pipe._S_out 中的说明自动替换

另一种选择是使用update 操作仅更新大小写不正确的文档。

【讨论】:

    【解决方案3】:

    您正在使用聚合查询,它将返回所有Gender 字段转换为小写的结果。如果您想更新某个字段的值,您必须使用 update 查询。

    由于您使用 pymongo 来查询您的文档,因此您的代码应该是这样的

    import pymongo
    from pymongo import MongoClient
    from bson.objectid import ObjectId
    
    db_info = {
        'db_name': 'MentalHealth',
        'collection_name': 'MentalHealth'
    }
    
    if __name__ == "__main__":
    
         mongo_client = MongoClient()
         mongo_db = mongo_client[db_info['db_name']]
         mongo_collection = mongo_db[db_info['collection_name']]
    
         for doc in mongo_collection.find(no_cursor_timeout=True):
                pk = ObjectId(str(doc.get("_id")))
                g = doc.get('Gender')
                if g:
                   g = g.lower()
                   mongo_collection.update({"_id": pk}, {"$set":{"Gender":g}}) 
    

    【讨论】:

    • 上述答案中的我的comment 也适用于您的答案
    猜你喜欢
    • 2018-12-04
    • 2017-11-26
    • 1970-01-01
    • 1970-01-01
    • 2017-09-02
    • 2017-10-12
    • 1970-01-01
    • 1970-01-01
    • 2016-11-10
    相关资源
    最近更新 更多