【发布时间】:2017-10-30 05:06:22
【问题描述】:
我们编写了一个 USQL 脚本来提取一个(.CSV 文件),其中所有列都被提取为一行。但是由于作业失败,我们无法处理所有文件。我们收到的错误消息是“VERTEX FAILED FAST”但是如果我们将文件格式转换为 (.Csv)(MS-DOS) 扩展名,作业就会被执行。 有人可以找出问题并告诉我们如何解决它。或任何其他将所有列提取为一行的方法也会有所帮助。我们还附上了脚本。
$scripts = @"
@rs =
EXTRACT
line string,
filename string
FROM "$filepath/$jobid/{filename}.csv"
USING Extractors.Text(delimiter:'\n', skipFirstNRows: 1);
@j =
SELECT *
FROM @rs;
@rs1 =
SELECT *
FROM @j
WHERE $output;
@k=
SELECT filename,COUNT() AS Count1
FROM @j
WHERE $output
GROUP BY filename;
OUTPUT @rs1
TO "$filepath/$jobid/logdata.txt"
USING Outputters.Text();
OUTPUT @k
TO "$filepath/$jobid/count.txt"
USING Outputters.Text();
"@
【问题讨论】:
标签: azure azure-data-lake u-sql