【问题标题】:Azure Data Factory Mapping Dataflow add RownumberAzure 数据工厂映射数据流添加行号
【发布时间】:2019-11-18 09:43:03
【问题描述】:
我认为这将是相当直截了当的,但我真的找不到一个简单的方法来做到这一点。我想向 ADF 映射数据流中的源数据集添加唯一的行号。在 SSIS 中,我会使用脚本组件来完成此操作,但据我在 ADF 中看到的,没有选择。我已经在派生列表达式编辑器和聚合组件中寻找合适的函数,但似乎没有。
有什么想法可以实现吗?
谢谢
【问题讨论】:
标签:
azure-data-factory
azure-data-factory-2
row-number
【解决方案1】:
许多选项:
- 添加代理键转换
- 使用 SHA2 在派生列中散列行列
- 在窗口转换中使用 rowNumber() 函数
试一试,让我们知道您的想法
【解决方案2】:
我是这样做的:
- 将具有相同值的列添加到所有行(我使用了 value = 1 的整数);
- 添加了一个窗口,使用先前在步骤 1 中创建的列(结束);
- 将第 4 步中的列添加到窗口(窗口列),名称任意,
rowNumber() 作为表达式;