【问题标题】:Can we able to Split PDF files using Pig Udfs?我们可以使用 Pig Udfs 拆分 PDF 文件吗?
【发布时间】:2016-05-03 07:45:00
【问题描述】:

我有 100 个 pdf,但每个 pdf 有 40 页,即它没有被处理。实际上,我们正在尝试使用猪 Udf??我们可以使用 Pig Udf 拆分 PDF 文件吗??

【问题讨论】:

    标签: apache-pig pdf-parsing pig-udf


    【解决方案1】:

    没有。虽然我对 Pig 不是很熟悉,但它似乎并不能原生地理解 PDF 文件格式,它是用于存储和分析数据,而不是处理文件。

    您可以将 Pig 与另一个理解 PDF 的库结合使用以拆分 PDF,虽然拆分 PDF 不需要 Pig,但这完全取决于使用 Pig 的工作流程/目的。

    【讨论】:

      猜你喜欢
      • 2018-11-01
      • 2017-01-03
      • 1970-01-01
      • 2011-02-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多