【发布时间】:2017-02-22 08:20:45
【问题描述】:
我有一个使用 Pentaho 的课程项目。我需要在 PostgreSQL 输出中使用 2 个不同的输入来创建仪表板。我的问题是,使用 Kettle,我必须匹配进入 Postgres 的两个不同的 .csv 文件。一个 csv 是关于犯罪的,另一个是关于天气的。我在天气一栏中手动添加了两列,因此它们有两个匹配的列:“月”和“年”。
我的问题是如何使用这些匹配的列(或者这样做是否有意义),以便我以后可以创建仪表板并进行诸如“下雨时犯了什么罪行?”之类的查询。
对不起,如果我不是很准确,我在使用 Pentaho 时有点迷茫。如果有人能给我一些帮助,我将不胜感激。
【问题讨论】:
-
您希望输出在一个表中还是两个单独的表中?
-
我不太确定,我需要能够基于两个 csv 进行查询。所以我不知道什么是最好的选择。我也需要选择度量/维度。我的想法是做一些过滤器,比如按“发生的城市”、“凶器”、“天气”排序。我真的很难理解这些概念。