【发布时间】:2017-03-10 11:12:01
【问题描述】:
我正在 Kettle 中进行一个相当长的转换,我在 Flow 的中间放置了一些步骤。 所以现在我的步数指标都被打乱了,很难阅读。 有什么办法可以让我再次按顺序(按流向)排序吗?
【问题讨论】:
标签: pentaho etl kettle pentaho-spoon pentaho-data-integration
我正在 Kettle 中进行一个相当长的转换,我在 Flow 的中间放置了一些步骤。 所以现在我的步数指标都被打乱了,很难阅读。 有什么办法可以让我再次按顺序(按流向)排序吗?
【问题讨论】:
标签: pentaho etl kettle pentaho-spoon pentaho-data-integration
如果您点击“步骤指标”标签中的#,它将按步骤对步骤进行排序。 “指标”选项卡中的可视化也将被排序。
【讨论】:
步骤按插入顺序存储。步骤度量网格允许通过单击列标题以不同的顺序显示步骤,但是由于可以对转换图进行网格化,因此通常无法按照数据流的顺序对步骤进行排序。无论如何,通过分析跃点只能对图中的单个路径进行排序。
【讨论】:
您可以做的是更改每个步骤的名称并在其前面添加一个数字。然后按名称排序。
无聊,我知道,但这是我们所拥有的......
【讨论】:
很遗憾,无法指定步骤编号。也许它因版本而异,但在 8.3 中,步骤度量 # 列分配似乎在某种程度上基于步骤在流程中的顺序(当流程分支时它当然会分解),而不是在添加步骤时。不过,它确实敲响了警钟,这是基于在过去的版本中添加步骤的时间。
不幸的是,按步骤名称排序是区分大小写的 - 因此以“a”开头的步骤排在以“Z”开头的步骤之后。也许有一种方法可以将这种行为纳入命名策略,实际上利用它来获得一些好处,但我还没有找到。
所以我倾向于同意@recacon - 为步骤名称使用数字前缀,然后按步骤名称对执行指标进行排序似乎是最好的选择。我还没有做太多这方面的工作,因为没有团队标准,它不太可能得到维护。
在我这样做的几次中,我使用了一个三位数的数字前缀,其中值在流程开始时最低,并在路径的下游增加。为了减少以后添加步骤时重新排序的需要,我开始从一个步骤到下一个步骤递增 10,然后在以后拆分跃点时使用一个数字。
我还会为流程中的分支增加 100 位,或者如果有用于特定目的的重要逻辑部分。
【讨论】: