【发布时间】:2015-07-17 04:07:17
【问题描述】:
我正在 R 中处理一个大文件,我只需要特定正则表达式的第一个匹配项,但 grep 正在进一步处理,这当然需要时间。
有什么办法让它在第一次比赛后停止?
编辑:似乎不是 grep 而是 readLines 很慢。读取 120MB 文件需要 20 秒...究竟如何从 data.table 中读取它在
【问题讨论】:
-
您可以将
grep包装到具有显式停止约束的循环中。会不会慢一些? -
您能给我们展示一个基准测试示例吗?我对length-1和length-40,000个字符都运行正则表达式,速度相差1-2%左右。
-
另外,你是如何处理文件的?
-
您能否提供一个使用
grep的代码示例?