【发布时间】:2014-08-23 00:11:19
【问题描述】:
我需要对大文件执行 2 个 unix 命令(.csv 以 \0001 分隔,几百万行,超过 15gb,在具有 24 核 512gb 内存的服务器上)。
我需要tr(将\0001替换为/t)然后sed在每行的末尾添加一个小字符串。
问题是我第一次运行 TR 然后,在将文件的所有行解析为新文件后,我执行 sed 命令添加到每一行。这需要很多时间!
有没有办法我可以只为 exec tr 和 sed 解析文件的每一行?
【问题讨论】:
-
只是出于兴趣:“走”是什么样的测量?
-
嗨 :) 好的,我是法国人,Giga Octets = Giga Bytes = 8 * Giga Bits