【发布时间】:2016-06-14 07:48:13
【问题描述】:
我希望使用 awk 语句或 Python 从长格式转置文件。
我的输入文件看起来像这样;
ID Chr_Position Geno
111 1_1234 0
111 1_12345 1
111 1_2345 0
111 2_23245 2
我需要的输出是(不一定需要标题)
ID 1_1234 1_12345 2_2345
111 0 1 0 2
112 1 1 1 1
113 1 1 0 2
它们是大文件,包含超过 100,000 个 ID,每个 ID 超过 10,000 行,但如果需要可以拆分成更小的文件。 我以前的代码会转置行和列,但不知道如何从长格式中获取它。
【问题讨论】:
-
为什么您的标题行中没有
1_2345和2_23245?2_2345是从哪里出现的?112和113行从哪里出现在您的输出中(如果答案来自您的输入文件,则编辑您的示例输入文件以包含它们)?
标签: python linux awk transpose