【问题标题】:Deleting a large number of records takes a VERY long time删除大量记录需要很长时间
【发布时间】:2013-05-02 18:41:06
【问题描述】:

我有一个包含约 60,000 行的数据库表(在 SQL Server 2012 Express 上运行)。

我正在使用以下代码清除旧行:

//Deleting CPU measurements older than (oldestAllowedTime)
var allCpuMeasurementsQuery = from curr in msdc.CpuMeasurements where 
    curr.Timestamp < oldestAllowedTime select curr;
foreach (var cpuMeasurement in allCpuMeasurementsQuery)
{
  msdc.CpuMeasurements.Remove(cpuMeasurement);
}

当删除的行数很大时(大约 90% 或更多的表中的记录正在被删除),操作会花费非常长的时间。在比较强大的机器(Intel I5 桌面)上完成这个操作大约需要 30 分钟。

  1. 这看起来像是正常行为吗?

  2. 有什么想法可以减少手术时间吗?

谢谢,

【问题讨论】:

  • 看看DeleteAllOnSubmit,可能会有帮助。
  • AFAIK 你正在做的是对数据库运行 60,000 多个删除命令。如果您可以只运行一个命令,或者成批运行几百个或更少的命令,则不会出现性能问题。
  • 实体框架在这类事情上并不擅长。最好创建一个您在时间戳中传递的存储过程,并以这种方式删除所有记录。
  • 我通常将这些包装在一个事务中。如果这不能改善事情,我会调用一个 SPROC 来完成这项工作,因为这将避免大量的网络流量。
  • 另外,您在 Timestamp 列上有索引吗?

标签: c# database linq optimization sql-server-2012-express


【解决方案1】:

实体框架不太擅长处理这样的批量操作。在这种情况下,您应该使用ExecuteStoreCommand 直接针对数据源执行 SQL。

var deleteOld = "DELETE FROM CpuMeasurements WHERE curr.Timestamp < {0}";
msdc.ExecuteStoreCommand(deleteOld, oldestAllowedTime);

通过这样做,您无需将实体加载到内存中(只是为了删除它们)并向数据库发出数千个删除命令。

【讨论】:

  • 感谢这里的所有建议。我现在选择这个解决方案,因为它似乎是最简单的(至少对我来说)。我确实认为这里提到的其他解决方案看起来很有希望(EntityFramework.Extended),当事情平静下来时我会检查它们。
【解决方案2】:

您应该查看EntityFramework.Extended,它是为了帮助批量删除和更新而创建的。

使用它,你可以简单地做到:

msdc.CpuMeasurements.Delete(curr => curr.Timestamp < oldestAllowedTime);

【讨论】:

    【解决方案3】:

    这样做的原因是您为每条记录执行数据库更新。您需要进行批量更新。

    EntityFramework.extended 可以处理这种情况。

    【讨论】:

      【解决方案4】:

      删除大量数据可能需要很长时间。

      您可能必须将 sql 移出应用程序并通过 SQL Server Agent 将其作为单个 sql 脚本运行。例如,它可以在最安静的时期每天运行一次。

      【讨论】:

        猜你喜欢
        • 2023-03-11
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2013-05-08
        • 1970-01-01
        • 2011-02-07
        相关资源
        最近更新 更多