【发布时间】:2018-04-15 19:25:48
【问题描述】:
谁能帮我从我的 csv 文件中删除旧记录并使用 Pig 保留最近的记录。
EX:输入
Key1 日期
XXXXX P38 17-10-2017
XXXXX P38 12-10-2017
YYYY P38 11-10-2017
YYYY P38 23-09-2017
YYYY P38 14-09-2017
ZZZZZ P38 25-10-2017
ZZZZZ P38 10-10-2017
我的预期输出是
Key1 日期
XXXXX P38 17-10-2017
YYYY P38 11-10-2017
ZZZZZ P38 25-10-2017
并且标题也包含在输出中。
请建议我怎样才能做到这一点?
【问题讨论】:
标签: hadoop bigdata apache-pig