没有回滚选项(在 MongoDB 上下文中为rollback has a different meaning),严格来说,没有支持的方式来取回这些文档 - 您可以/应该采取的预防措施已包含在 cmets 中。然而,话虽如此,如果你正在运行一个副本集,甚至是一个单节点副本集,那么你就有一个oplog。使用包含文档插入时间的oplog,您也许可以恢复它们。
说明这一点的最简单方法是举个例子。我将使用一个简化的示例,其中只有 100 个需要恢复的已删除文档。要超越这一点(大量文档,或者您可能只希望有选择地恢复等),您可能想要更改代码以迭代游标,或者在 MongoDB shell 之外使用您选择的语言编写它。基本逻辑保持不变。
首先,让我们在数据库dropTest 中创建我们的示例集合foo。我们将插入 100 个没有 name 字段的文档和 100 个具有相同 name 字段的文档,以便以后错误地删除它们:
use dropTest;
for(i=0; i < 100; i++){db.foo.insert({_id : i})};
for(i=100; i < 200; i++){db.foo.insert({_id : i, name : "some_x_name"})};
现在,让我们模拟一下意外删除我们的 100 个name 文档:
> db.foo.remove({ "name" : "some_x_name"})
WriteResult({ "nRemoved" : 100 })
因为我们在副本集中运行,所以我们仍然在 oplog(正在插入)中有这些文档的记录,幸运的是,这些插入还没有(还)从 oplog(@ 987654336@ 是capped collection 记住)。让我们看看能不能找到它们:
use local;
db.oplog.rs.find({op : "i", ns : "dropTest.foo", "o.name" : "some_x_name"}).count();
100
计数看起来正确,我们的文件似乎还在。我从经验中知道,我们在这里需要的唯一 oplog 条目是 o 字段,所以让我们添加一个投影以仅返回它(为简洁起见,输出被剪断,但你明白了):
db.oplog.rs.find({op : "i", ns : "dropTest.foo", "o.name" : "some_x_name"}, {"o" : 1});
{ "o" : { "_id" : 100, "name" : "some_x_name" } }
{ "o" : { "_id" : 101, "name" : "some_x_name" } }
{ "o" : { "_id" : 102, "name" : "some_x_name" } }
{ "o" : { "_id" : 103, "name" : "some_x_name" } }
{ "o" : { "_id" : 104, "name" : "some_x_name" } }
要重新插入这些文档,我们可以将它们存储在一个数组中,然后遍历该数组并插入相关的片段。首先,让我们创建我们的数组:
var deletedDocs = db.oplog.rs.find({op : "i", ns : "dropTest.foo", "o.name" : "some_x_name"}, {"o" : 1}).toArray();
> deletedDocs.length
100
接下来我们提醒自己,现在集合中只有 100 个文档,然后循环遍历 100 个插入,最后重新验证我们的计数:
use dropTest;
db.foo.count();
100
// simple for loop to re-insert the relevant elements
for (var i = 0; i < deletedDocs.length; i++) {
db.foo.insert({_id : deletedDocs[i].o._id, name : deletedDocs[i].o.name});
}
// check total and name counts again
db.foo.count();
200
db.foo.count({name : "some_x_name"})
100
你有它,有一些警告:
- 这并不是一个真正的恢复策略,请查看备份(MMS,其他),为此延迟辅助,如 cmets 中所述
- 在大型繁忙系统上从 oplog 中查询文档不会特别快(任何 oplog 查询都是表扫描)。
- 文档可能随时过期超出 oplog(当然,您可以制作 oplog 的副本以供以后使用以给您更多时间)
- 根据您的工作量,您可能需要在重新插入之前对结果进行重复数据删除
- 较大的文档集对于数组来说太大了,如图所示,因此您需要迭代游标来代替
-
oplog 的格式被视为内部格式,可能随时更改(恕不另行通知),因此使用风险自负