【发布时间】:2016-05-27 11:09:10
【问题描述】:
我有一个大文件,有 50 列和 10 万行,由 | 分隔。现在 $2(col 2) 有多种类型的 $1(col 1) 值,这意味着 col 2 将被重复。所以我已经对文件进行了排序。
我现在需要根据以下条件提取/过滤结果文件:
- 条件1:当
$2同时具有$1的类型时($2的$1的值大于8000以及小于8000)然后选择完整的行这是$1$2 为 8000 - 条件2:如果
$2只有$1 > 8000,则选择具有最大$8值的完整行
例如:源文件
4000|1234||||||23
5000|1234||||||22
9000|1234||||||25
10000|123|||||||22
22000|456|||||||27
15000|456|||||||29
结果文件有:
9000|1234||||||25
10000|123|||||||23
15000|456|||||||29
有人可以请教一下吗?提前致谢
【问题讨论】:
-
为什么
22000没有输出? -
为什么没有输出 22000? ANS-- 因为 $2(456) 的值只有 >8000,所以基于 $9 (29) 选择的行的最大值为 29>27
-
不清楚,为什么
123行没有在最后一列显示22? -
当
$2同时具有$1这两种类型时"是什么意思? -
措辞不清楚。
Now $2(col 2) has multiple type of $1(col 1) value which means col 2 will be repeated.--multiple type是什么意思?