【发布时间】:2015-11-08 20:32:17
【问题描述】:
我有一些大的 *.cvs 文本文件,看起来像这样:
Word,Tag,Lemma
Off,aa,off
short,aa,short
and,sfg3eþ,and
tall,sþghen,tall
deers,aþ,deer
in,never,in
Africa,nc,Africa
frv.,aa,frv.
---,ta,---
,,
All,nhfn,all
allowed,lhfnsf,allow
personell,c,personell
aggr.,lheþsf,aggr.
with,aþ,with
23,ta,23
as.,nvfn,as.
sillable.,lheþsf,sillable.
,,
Á,aþ,á
我需要处理这个文件,以便将第一列放在这样的列表中:
{[Off short and tall deers in Africa frv],[All allowed personnel aggr. with 23 as syllable.],[Á......],...n]}
最后需要一个:]}
我尝试过的:
awk 'BEGIN {FS=",";print"{["} /",,"/ {print"],["} END {print"]}"}' 079.cvs
仅打印: {[ ]}
我还发现了这个:
cat 080.csv | cut -d ',' -f3 >>D.txt
这实际上非常有用:
Off
short
and
tall
....
但实际上是为了“深入”文件而遗漏了列表元素。
【问题讨论】:
-
不接受答案以删除您的问题是不好的。如果您使用我的帮助,请保持礼貌。查看您已删除的问题:Producing number sequences。
标签: awk text-processing