【发布时间】:2013-07-20 17:07:43
【问题描述】:
我一直在搞乱 awk,因为我认为使用这个工具来处理制表符分隔或 csv 文件的标题要简单得多..
我有两种类型的文件(逗号或制表符分隔),我想做的就是将标题 (NR =1) 修改为:
- 降低所有单词的大小写
- 用下划线替换每个空格 字段名称.. 例如。将癌症类型更改为 *cancer_type*
癌症类型、组装版本、染色体、染色体 开始,染色体结束
到目前为止,我所做的只是列出第一行
awk 'NR == 1' test2.csv
好吧,我很茫然。无论如何,我可能会在进行一些下游修改之前运行此脚本(sed 或 awk)。
任何帮助(或指向我一个好的教程/一个班轮)将不胜感激。
编辑
您好,我应该编辑以澄清这一点。 我将从一个文件开始,并以相同的文件结束,但标题已更改。
我可以获得两个版本的文件。
CSV
癌症类型、组装版本、染色体、染色体起始、 染色体末端
之后:
cancer_type,assembly_version,染色体,chromosome_start, 染色体末端
TSV
癌症类型\t 组装版本\t 染色体\t 染色体开始\t 染色体末端
之后:
cancer_type\t 组装版本\t 染色体\t 染色体开始\t 染色体末端
话虽如此,我认为方法几乎奏效了..
编辑 2 操作系统是 OS X 10.7.+
【问题讨论】: