【发布时间】:2011-09-23 09:47:01
【问题描述】:
我想就如何对大文件(数百万行或几行)进行子集化获得您的建议/帮助。
例如,
(1) 我有大文件(数百万行,制表符分隔)。我想要这个文件的一个子集,只有从 10000 到 100000 的行。
(2) 我有大文件(数百万列,制表符分隔)。我想要这个文件的一个子集,只有从 10000 到 100000 的列。
我知道有一些工具,如 head、tail、cut、split 和 awk 或 sed。我可以用它们来做简单的子集。但是,我不知道如何完成这项工作。
您能给点建议吗?提前致谢。
【问题讨论】: