【发布时间】:2017-08-04 19:03:26
【问题描述】:
我有一个像this这样的文本文件:
Education June 2007 Bachelors of Science in
Business Administration ORGANIZATION ,
University of Phoenix ORGANIZATION .
June 2005 Associate of Arts in
Liberal Arts ORGANIZATION ,
Victor Valley Junior College ORGANIZATION ,
Victorville LOCATION ,
CA LOCATION .
我想检索分隔前两列的制表符,所以我使用了这个:
cut -f 1-2 input.txt > output.txt
效果很棒!
现在,我想要在第二列中包含 ORGANIZATION 并在第一列中包含特定单词的行,即对于每一行,如果第二列显示 ORGANIZATION,请检查第一列是否包含单词“University”, School","College"等,如果是,写在输出文件中。
有没有什么办法可以通过修改下面的代码或者用python写一个新的来实现?:
cut -f 2-3 input.txt > output.txt
输出应如下所示:
University of Phoenix ORGANIZATION
Victor Valley Junior College ORGANIZATION
【问题讨论】:
-
预期输出是什么?试试这个可能有帮助
awk '$2 ~ /ORGANIZATION/ && $1 ~ /University|School/' inputfile -
为什么这个标签是python?
-
@PS。 - 不工作。
-
@ChristianW。 - 如果它不能通过修改它,我想要一个 python 解决方案。
-
您需要将示例输出添加到问题中,以确保在这里回答的人不会浪费您和他们的时间。
标签: python bash python-3.x filter classification