【发布时间】:2009-10-02 13:16:31
【问题描述】:
我找到了大量使用正则表达式替换文件中文本的示例。然而,这一切都归结为两个版本:
1. 遍历文件中的所有行并将正则表达式应用于每一行
2. 加载整个文件。
没有。 2 使用“我的”文件是不可行的 - 它们大约 2GiB...
至于第 1 号:目前这是我的方法,但我想知道......如果需要应用跨越多行的正则表达式怎么办?
【问题讨论】:
-
是否可以将这些数据加载到 RDBMS 中?
-
我认为您需要更好地描述您的数据和正则表达式以获得体面的建议。
-
好的。一点澄清:我经常需要修改大型 csv 文件。 (例如 switch col 3 和 5)我发现,使用 regex 和 sed,我可以快速应用所需的修改。但是,我使用 The Regulator “开发”并测试我的正则表达式,这将导致“clr-regex”,然后必须将其翻译成 sed 语法。为了避免这种情况,我编写了一个小工具(c#),它可以让我将“clr-regex”应用于文件。现在:使用此工具,无法应用跨越多行的正则表达式 - 因为我正在执行上述方法。 1. 上述问题有些假设性。
-
请通过编辑问题进行澄清,而不是添加 cmets。
-
瑞恩,谢谢。我想我是在 2010 年的某个时候开始这样做的 ;-)
标签: c# .net regex large-files