【发布时间】:2015-10-22 20:30:19
【问题描述】:
您好,尝试将一个大文件.dat (120 Mb) 拆分为许多小文件。
我知道split 命令应该为我执行此操作,比如说:
split --lines=#number file.dat
但是这会将我的大文件分成许多具有相同行数(#number)的文件。
如果我想要一个类似 if 的条件来分割文件,我该怎么做?
例如:当第一列的整数部分与前一个不同时,我想分割这个文件。
file.dat 示例应该是:
1.2 432.1 87.1
1.3 3.5 557.2
2.1 1.2 43.56
2.33 19.2 34.7
2.4 32.6 41.8
2.56 23.5 66.9
4.1 143.7 54.0
5.5 432.8 23.4
6.7 423.9 0.3
在这个例子中,我应该有 5 个不同的文件,第一个包含前两行;第二个有四行;第三个用一根线,依此类推。 这可能吗?谢谢大家。
【问题讨论】:
-
您希望您的完整数据集创建多少个输出文件?