【发布时间】:2013-01-08 15:39:54
【问题描述】:
我有一个巨大的文本文件(19GB 大小);它是一个包含变量和观察值的遗传数据文件。
第一行包含变量名称,它们的结构如下:
id1.var1 id1.var2 id1.var3 id2.var1 id2.var2 id2.var3
我需要交换 id1、id2 等。具有另一个文本文件中的相应值(该文件大约有 7k 行)ID 没有任何特定顺序,其结构如下:
oldId newIds
id1 rs004
id2 rs135
我已经进行了一些谷歌搜索,但无法真正找到一种允许执行以下操作的语言:
- 阅读第一行
- 用新的 ID 替换 ID
- 从原始文件中删除第一行并用新的替换它
这是一个好方法还是有更好的方法?
哪种语言最适合实现这一目标?
我们有在 python、vbscipt 和 Perl 方面有经验的人。
【问题讨论】: