【问题标题】:NiFi: How to combine data from many files into one fileNiFi:如何将多个文件中的数据合并到一个文件中
【发布时间】:2017-11-21 00:51:51
【问题描述】:

我想从 hdfs 获得超过 20,000 个flowfile 并将它们重新组合成一个flowfile

我想从这些文件中获取数据(它们是 xml 格式)并将其输入到名为 content 的变量中,然后当我完成这个过程时,我想在一个这样所有这些数据都将在<data>...</data>标签中注册)

是否可以通过 NiFi 处理器来完成这项任务,否则我将不得不使用 groovy 代码?

【问题讨论】:

    标签: groovy apache-nifi


    【解决方案1】:

    这在标准 NiFi 构建中是不可能的。您当然可以创建自己的 NiFi 处理器来执行此操作,但这可能有点矫枉过正。

    您将不得不使用 groovy。我建议这样做:

    1) 从 HDFS 文件夹中读取文件

    2) 处理这些文件并从您想要的文件中获取数据。

    3) 如果您想要生成单个 xml 文件:在处理每个文件并获取信息时,使用 fileoutputstream 直接写入 XML 文件。这可以在本地完成,然后一旦完成,它可以移回 HDFS/NiFi 监视的文件夹以继续您的管道。

    注意:有一个 处理器可以连接文件(或如您所说的“重新组合”) - MergeContent 处理器。不过,在您的情况下,这可能有点没有实际意义。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-04-04
      • 2020-07-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多