【发布时间】:2019-11-07 12:18:31
【问题描述】:
我的任务是将数百万个单个 JSON 文件转换并合并为 BIG CSV 文件。
使用复制活动和映射模式的操作将非常简单,我已经测试过,问题是大量文件的 JSON 格式不正确。
我知道错误是什么,而且修复也很简单,我想我可以使用 Python 数据砖活动来修复字符串,然后将输出传递给可以将记录合并为大 CSV 的复制活动文件。
我有这样的想法,我不确定这是否是解决此任务的正确方法。我不知道在 Data Brick 活动中使用 Copy Activy 的输出
【问题讨论】:
标签: python azure azure-data-factory-2