在开始或结束时更好地过滤数据流？答案

【问题标题】：Better to filter a stream of data at its start or end?在开始或结束时更好地过滤数据流？
【发布时间】：2010-12-10 04:05:53
【问题描述】：

我正在处理一个需要处理大量（数 GB）逗号分隔值 (CSV) 文件的项目。

我的基本做法如下：

我想知道在源端进行过滤是否会更好，例如每个侦听器都有一个关联的 Predicate 对象，该对象确定是否应将给定的数据分派给侦听器，在这种情况下，流程看起来更像

最终效果是一样的，只是过滤发生在哪里的问题。

（同样，我拥有一次处理一个条目的这种“数据流”的唯一原因是因为我正在处理千兆字节的 CSV 文件，并且我无法创建集合、过滤它，并且然后处理它 - 我需要随时过滤）

【问题讨论】：

【解决方案1】：

除非调用侦听器的成本很大（Remoting、WCF、...），否则我会保留一个非常简单的界面，让侦听器决定如何处理该行。

【讨论】：