【发布时间】:2013-11-13 16:55:05
【问题描述】:
我有非常大的基因型文件,基本上不可能在 R 中打开,所以我尝试使用 linux 命令行提取感兴趣的行和列。行使用头/尾很简单,但我很难弄清楚如何处理列。
如果我尝试使用
提取(例如)第 100-105 个制表符或空格分隔的列 cut -c100-105 myfile >outfile
如果每列中有多个字符的字符串,这显然是行不通的。有没有办法用适当的参数修改 cut 以便提取列中的整个字符串,其中列定义为空格或制表符(或任何其他字符)分隔?
【问题讨论】:
-
哇。你的意思是
-c100-105,不是-c100-1005,不是吗?你不想要一千零五列吗?到目前为止提交的两个答案使用 1005 ! -
是的,我做到了,虽然原理还是一样。
-
我不确定您所说的“如果每列中有多个字符的字符串显然将无法工作”是什么意思。
标签: linux