【发布时间】:2018-03-05 14:52:51
【问题描述】:
假设 azure 数据湖存储中有两个文件集 A 和 B。
/A/Year/
/A/Month/Day/Month/
/A/Year/Month/Day/A_Year_Month_Day_Hour
/B/Year/
/B/Month/Day/Month/
/B/Year/Month/Day/B_Year_Month_Day_Hour
我想获取一些值(假设是 A 实体的 DateCreated)并使用这些值生成 B 集的文件路径。
我怎样才能做到这一点?
一些想法,但我不确定。 1.从A中选择值 2. 存储在一些存储上(天蓝色数据湖或天蓝色 sql 数据库)。 3. 建立一个逗号分隔的字符串 pStr 4. 通过数据工厂将 pStr 传递给存储过程,该存储过程生成带有模式的文件路径。
编辑
根据@mabasile_MSFT 的回答
这是我现在拥有的。 第一个生成 json 文件的 USQL 脚本,如下所示。
{
FileSet:["/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__12",
"/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__13",
"/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__14",
"/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__15"]
}
包含查找和第二个 USQL 脚本的 ADF 管道。 查找读取此 json 文件 FileSet 属性,据我了解,我需要以某种方式将此 json 数组传递给第二个脚本,对吗? 但是 usql 编译器会生成像
这样的字符串变量DECLARE @fileSet string = "["/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__12", "/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__13", "/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__14", "/Data/SomeEntity/2018/3/5/SomeEntity_2018_3_5__15"]"
脚本甚至没有在它之后编译。
【问题讨论】:
-
想知道您是如何解决这个问题的?
标签: azure-data-factory azure-data-lake u-sql