【发布时间】:2013-05-15 10:25:47
【问题描述】:
我正在使用 Kettle 阅读 Excel 表格,该表格包含三个字段:代码、描述和日期。
示例:
1 - description A - 01/JAN/2013
2 - description A - 15/JAN/2013
3 - description A - 04/JAN/2013
4 - description B - 02/JAN/2013
5 - description B - 16/JAN/2013
6 - description B - 11/JAN/2013
我想要的是为每一行添加一个附加字段 Max date,其中 max date 是基于描述的组的最新日期,如下所示:
示例 2
1 - description A - 01/JAN/2013 - 15/JAN/2013
2 - description A - 15/JAN/2013 - 15/JAN/2013
3 - description A - 04/JAN/2013 - 15/JAN/2013
4 - description B - 02/JAN/2013 - 16/JAN/2013
5 - description B - 16/JAN/2013 - 16/JAN/2013
6 - description B - 11/JAN/2013 - 16/JAN/2013
具有描述 A 的行组的最新日期为 15/JAN/2013(因为第 2 行)。 具有描述 B 的行组的最新日期为 16/JAN/2013(因为第 5 行)。
【问题讨论】:
标签: etl kettle pentaho-data-integration