【问题标题】:Line Spacing on Itext or Adobe AcrobatItext 或 Adob​​e Acrobat 上的行距
【发布时间】:2018-04-23 09:27:22
【问题描述】:

我可以更改现有 PDF 上的段落行间距吗?不是新的PDF。 请告诉我如何改变。各种方式。谢谢。

【问题讨论】:

  • 我会用手动方式进行更改。像 java 或 javascript。
  • PDF 通常是从 HTML 或 Microsoft Word 等可编辑文件格式转换而来的。更改原始文档中的段落行距并再次转换。如果您没有原始的可编辑文件格式,请参阅 Joris 的回答。

标签: javascript java itext


【解决方案1】:

根据您的 PDF 文档是否被标记,以及您愿意在机器学习和 AI 上投入多少努力,答案从“可能”到“不是一百万年”不等

让我解释一下。

PDF 文档主要是一组指令,告诉查看者如何呈现文档。它(通常)不包含任何逻辑结构。 因此,即使您(人类最终用户)可以清楚地看到一个段落,这并不意味着计算机能够判断文档的哪些部分构成一个段落。

如果您的文档被标记(意味着它具有这种逻辑结构):

  • 更改行高可能需要您再次执行布局
  • 图片可能需要放置在稍微不同的位置
  • 页面可能溢出
  • 桌子可能不再适合

您需要提供能够处理所有这些情况的代码。 这甚至是happy flow

如果您的文档未加标签,任务会变得更加困难。 让计算机识别原始 PDF 内容的结构很困难。这是许多 PDF 公司正在进行的研究任务。 你会发现很多关于这个主题的论文。大多数人倾向于专注于提取单一类型的信息(如表格、列表或文本),而不是所有信息。

简而言之,答案是可能不是

【讨论】:

  • 非常感谢。你的回答让我深信不疑。
猜你喜欢
  • 1970-01-01
  • 2019-01-02
  • 2014-09-12
  • 1970-01-01
  • 2014-12-23
  • 2013-09-19
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多