【发布时间】:2015-03-20 22:30:30
【问题描述】:
我想根据一列值将大文件(1.85 亿条记录)拆分为多个文件。文件是 .dat 文件,列之间使用的分隔符是 ^A (\u0001)。
文件内容是这样的:
194^A1^A091502^APR^AKIMBERLY^APO83^A^A^A^A0183^AUSA^A^A^A^A^A^A^A^A
194^A1^A091502^APR^AJOHN^APO83^A^A^A^A0183^AUSA^A^A^A^A^A^A^A^A
194^A^A091502^APR^AASHLEY^APO83^A^A^A^A0183^AUSA^A^A^A^A^A^A^A^A
194^A3^A091502^APR^APETER^APO83^A^A^A^A0183^AUSA^A^A^A^A^A^A^A^A
194^A4^A091502^APR^AJOE^APO83^A^A^A^A0183^AUSA^A^A^A^A^A^A^A^A
现在我想根据第二列的值来拆分文件,如果你看到第三行第二列的值是空的,所以所有的空行都应该是一个文件,剩下的应该是一个文件。
请帮助我。我试着用谷歌搜索,看来我们应该为此使用 awk。
问候, 尚卡尔
【问题讨论】: