【问题标题】:perl, extract TOC from PDF fileperl,从 PDF 文件中提取 TOC
【发布时间】:2015-03-20 09:13:33
【问题描述】:

我已经检查了 CAM::PDF 和其他 PDF 相关模块,但无法确定是否有办法从清晰的 PDF 文件中提取目录。

如果有任何想法,我将不胜感激!

【问题讨论】:

  • 你看过 iText 吗?

标签: perl pdf tableofcontents


【解决方案1】:

我无法找到可靠地支持提取 pdf 书签(我假设您的意思是目录)的库。

不过,pdftk 在这方面做得很好,可以从命令行运行;

pdftk myfile.pdf dump_data | grep BookmarkTitle > outline.txt

【讨论】:

  • 哦,谢谢。我实际上需要每个书签的页码,但是通过您的示例,我发现了 pdftk my.pdf dump_data | grep BookmarkPageNumber > 2A_outline.txt
猜你喜欢
  • 1970-01-01
  • 2010-11-11
  • 1970-01-01
  • 2023-03-10
  • 1970-01-01
  • 2011-04-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多