在 .NET 中,IEnumerable<T> 序列是惰性的:这意味着当且仅在您需要时才执行底层逻辑。一个副作用是,如果您需要两次结果,则逻辑会执行两次。
例如,如果序列绑定到 SQL 数据库的结果,如果先计算元素个数,然后将它们全部列出,则 SQL 查询将执行两次。
一些 LINQ 方法只是转换您将得到的结果,而没有实际得到结果。例如,var b = a.Where(a > 0); 不会运行底层逻辑,而是推迟到您真正需要结果为止。
其他 LINQ 方法有效地强制执行逻辑。例如,Count() 将强制加载所有元素以计算它们。 ToArray() 或 ToList() 也会这样做,将元素存储在内存中以供进一步使用。
您正在寻找的方法完全取决于上下文。
通常,您可能希望将序列存储在内存中(例如使用ToList()),以便稍后对其执行多项操作,例如计算元素的数量,然后循环遍历所有元素。另一方面,在某些情况下您还需要其他东西:
-
底层逻辑的影响可能太大,无法将所有内容加载到内存中,迫使您寻找更智能的解决方案。想象一下,您正在进行数据库搜索,并且想要显示结果的数量(比如 2 000 000)以及前 20 个条目。您真的需要将所有 2 000 000 个结果存储在内存中吗?应该不会吧。
这里的解决方案是执行count SQL 查询(数据库引擎将能够优化),然后执行实际查询以获得前 20 个结果。
一个类似的例子是当你得到几个元素,但它需要很多 CPU 周期才能得到一个元素。有时,当您只需要计算元素时,可以使用快捷方式来缩短复杂的工作。
或者可能发生相反的情况:底层逻辑和数据量太小而无法真正关心。假设您正在处理A-Za-z 范围内的字符。真的有必要做ToList()吗?数数,然后分别循环遍历字符不是更容易吗?
有时,甚至不可能将所有元素都存储在内存中。例如,如果您有一个无限序列(例如从不断写入的日志文件中刷新的行)怎么办?
但是,如果我正确理解 LINQ,它将执行相同的操作——在本地执行相同的循环和逻辑,而无需任何特殊优化——无论我得到 Count() 还是执行 foreach。
这完全取决于您使用的 ORM。当您创建 LINQ 查询时,例如:
var count = this.SequenceFromDatabase
.Where(product => product.Price > 0)
.Count();
foreach (var product in this.SequenceFromDatabase.Take(10))
{
...
}
一些(如果不是大多数)ORM 实际上会将其转换为:
select count(1) from [Schema].[Table] where [Price] > 0
select top 10 [Name], [Price], [Availability] from [Schema].[Table]
鉴于从 LINQ 到 SQL 查询的实际转换取决于 ORM 和您编写的实际 LINQ 代码,因此必须密切关注正在执行的 SQL 查询。许多 ORM 具有跟踪 SQL 查询的能力,并且一些 SQL 引擎还允许您分析查询。