【问题标题】:Delimited File with Varying Number of Rows Azure Data Factory具有不同行数的分隔文件 Azure 数据工厂
【发布时间】:2021-09-01 15:05:06
【问题描述】:

我有一个由哈希分隔的分隔文件,看起来有点像这样,

价值#价值#价值#价值#价值#价值##价值

价值#价值#价值#价值##价值#####价值#####价值

价值#价值#价值#价值###价值#价值####价值##价值

如您所见,当用哈希分隔时,第 2 行和第 3 行的列数比第一行的多。我希望能够在经过一些转换后使用 ADF 数据流将其摄取到数据库中。但是,每当我尝试进行任何类型的映射时,我总是只能看到 7 列(第一行的列数)。

有没有办法获取所有值?与项目数量最多的行中的列一样多?我不介意空值。

注意:我没有标题行。

【问题讨论】:

  • 您能否尝试将示例文件包含所有列数并导入架构。
  • 这是个好方法。我实际上在 Azure 函数中使用 pandas 将文件转换为 csv,然后触发了管道。有了这个,我们实际上可以避免函数,是吗?
  • 如果它足以满足您的问题,请接受以下答案,以便问题得到回答:)

标签: azure azure-data-factory-2


【解决方案1】:

Azure 数据工厂直接无法导入具有最大列数的架构行。因此,确保文件中的列数相同非常重要。

您可以使用 Azure 函数来验证您的文件并对其进行更新以在所有行中获得相同数量的列。

您可以尝试使用具有最大列数的行的本地文件并从文件中导入架构,否则您必须使用 Azure Functions,您必须在其中转换文件然后触发管道.

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2022-08-22
    • 2021-03-09
    • 1970-01-01
    • 1970-01-01
    • 2020-11-30
    • 2021-11-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多