【发布时间】:2016-11-08 14:45:11
【问题描述】:
我有一些巨大的技术 pdf 电子书,我想将它们分开,以帮助我从每本书中找到并准确阅读我想要的部分。我说的是带有内容(部分和章节)的索引 pdf 文件。根据 pdf 的内容,我提出了以下拆分方案:
1.阅读本书的内容。 2.为整本书创建一个根文件夹 3. 为书的每一部分创建一个子文件夹 4. 将本书每章拆分成一个pdf文件,并将pdf(章节)放在相应的子文件夹(part)中。
如何使用 Java 或 Python pdf 库来做到这一点?
【问题讨论】:
-
通过编写一些代码。 :) 您可能还会寻找已经解析 PDF 和电子书的库。
-
嗯,这很明显 :) 我的主要问题是找到一个提取 pdf 元数据的库,正是它包含的书的内容!
-
我知道。这就是为什么我要求使用库,而不是代码。如果有合适的库,我会用它来编写代码我自己。
-
如果您阅读如何提问,您会发现请求异地联络也不是一个好问题。