【发布时间】:2014-06-14 01:59:18
【问题描述】:
我正在开发一个将 pdf 内容转换为文本的 C# winform 应用程序。除了在 pdf 的突出显示文本中找到的内容外,所有必需的内容都被提取出来。 请帮助获取工作示例以提取 pdf 中的突出显示文本。 我在项目中使用 iTextSharp.dll
【问题讨论】:
-
你说的是注解吗?你需要更清楚。注释是不属于页面内容流的元素。它们始终添加在页面顶部并具有自己的外观流。您可以在 Adobe Reader 的单独面板中列出它们。我们在谈论那种内容吗?
标签: pdf itextsharp pdf-scraping