【发布时间】:2014-05-26 13:00:16
【问题描述】:
我使用 txt 文件(unix、shell 脚本),这些文件是由管道分隔的数百万字段,而不是由 \n 或 \r 分隔的。
像这样:
field1a|field2a|field3a|field4a|field5a|field6a|[...]|field1d|field2d|field3d|field4d|field5d|field6d|[...]|field1m|field2m|field3m|field4m|field5m|field6m|[...]|field1z|field2z|field3z|field4z|field5z|field6z|
所有文本都在同一行。
每个文件的字段数是固定的。
(在这个例子中我有field1=name; field2=surname; field3=mobile phone; field4=email; field5=office phone; field6=skype)
当我需要查找字段(例如 field2)时,像 grep 这样的命令不起作用(在同一行中)。
我认为一个好的解决方案是编写一个脚本,用“\n”分割每 6 个字段,然后执行 grep。我是正确的?非常感谢!
【问题讨论】:
-
只是想知道,为什么你的文本文件是这样构建的?
-
为什么有人会否决这个问题?因为OP必须以愚蠢的格式处理文件??
-
我收到了这些文件。就像一个文件存档器,保存所有处理过的信息:D