【发布时间】:2014-04-23 01:35:46
【问题描述】:
如何使用 awk 或其他 linux 程序指定文本限定符?
我的数据如下所示:
它实际上是制表符分隔的,但有些字段内部有一个制表符。字段由双引号限定。
如何指定字段不仅由制表符分隔,而且字段由引号分隔?
这是我目前的脚本:
awk '{OF=OFS="\t"}{print $1,$7,$8,$10,$11,$21}' cyme.txt | grep -i pilates
另外,出于实际目的,我还包含了一个数据样本的完美文本副本:
"723721093013" "AFL" "1" "" "15" "ALT ROCK...." "Hai!........................" "Creatures, The.............." 2 "N" 4 7.48 2004.02.17 0.0000 . . . . 2
"723721093112" "AFL" "1" "" "5" "ELECTRONIC.." "Crash And Burn.............." "Foxx, John/Gordon, Louis...." 1 "W" 4 11.98 2004.02.17 0.0000 . . . . 73
"819162013137" "AHY" "1" "" "101" "PUNK........" "Truth, Love and Liberty....." "FM359......................." 2 "H" 1 4.48 2014.01.14 0.0000 . . . . 39
"879198005148" "AHY" "1" "" "14" "PUNK........" "Re-Volts S/T................" "Re-Volts, The..............." 1 "J" 4 5.48 2007.12.11 0.0000 . . . . 10
"879198004288" "AHY" "1" "" "24" "PUNK........" "Read Between The Lines......" "Smalltown..................." 1 "N" 4 7.48 2009.12.01 0.0000 . . . . 17
如果有任何需要澄清的地方,请告诉我。 如何使用 awk 或其他 linux 程序指定文本限定符?
我意识到,令人惊讶的是,awk 可能不是这项工作的正确工具,如果确实如此,我很高兴了解应该使用其他命令来处理带有字段限定符的文本文件。
【问题讨论】: