【发布时间】:2013-06-19 07:41:54
【问题描述】:
我有一个包含以下条目的文件:
1,1,07 2012,07 2013,11,blablabla
前两个字段是 id。第三个是开始日期(月年),第四个是结束日期。第五个字段是这两个日期之间的月数。最后一个字段包含文本。
这是我加载这些数据的猪代码:
f = LOAD 'file.txt' USING PigStorage(',') AS (id1:int, id2:int, date1:chararray, date2:chararray, duration:int, text:chararray);
我想过滤我的文件,以便只保留 date2 从今天起不到三年的条目。猪有可能吗?
谢谢。
【问题讨论】:
-
可以写一个过滤函数。 Here是Writing Filter Functions的介绍(在本页搜索Writing Filter Functions)。
-
谢谢,我会看的。
标签: hadoop apache-pig