【问题标题】:Merging multiple xml files to a csv file using azure Data Factory使用 azure 数据工厂将多个 xml 文件合并到 csv 文件
【发布时间】:2021-04-23 17:22:18
【问题描述】:

我已经建立了一个数据工厂管道来下载 zip 文件(打开 https 链接源 URL 参考:https://clinicaltrials.gov/AllPublicXML.zip)。将相同的文件解压到包含多个 xml 格式文件的文件夹中。Copy and Extracting Zipped XML files from HTTP Link Source to Azure Blob Storage using Azure Data Factory 现在我想将文件夹中的所有 XML 文件合并为 CSV 文件。我在数据工厂内使用复制活动。导入架构时,我收到以下错误消息

Input XML file 'input/ALLPublicXML.zip' is invalid with parsing error 'Data at the root level is invalid. Line 1, position 1.'. Data at the root level is invalid. Line 1, position 1. . Activity ID: 358b3545-f49c-4bba-8adc-13fb3de9bb20

不完全确定出了什么问题,但如果有人可以指导我完成该过程,那将非常有帮助。

【问题讨论】:

    标签: xml azure azure-data-factory azure-data-factory-2 azure-data-lake-gen2


    【解决方案1】:

    这似乎是一个编码问题,你可以检查一下文件的编码,它应该遵循以下编码格式:

    文件中可能有一些额外的字符不允许读取,更多信息可以找到here

    【讨论】:

    • 谢谢,很高兴我的回答对您有所帮助,您能投票吗:)
    猜你喜欢
    • 2020-12-04
    • 2021-08-13
    • 2020-05-10
    • 2022-11-04
    • 1970-01-01
    • 2021-07-17
    • 1970-01-01
    • 2019-12-25
    • 1970-01-01
    相关资源
    最近更新 更多