【发布时间】:2012-07-08 03:04:25
【问题描述】:
我需要加载一个 pdf 文件,然后以编程方式将其转换为文本文件,以便对其进行解析。
另一种可能性是执行文件(执行 Adobe Reader,以 pdf 文件作为参数),然后向其“发送密钥”以将文件保存为文本。
但是,我不希望这样做(打开文件),但如果这是唯一的解决方案,我会这样做。但是:甚至可以在 C#/WPF 中执行“发送密钥”之类的功能吗?
注意:我不想购买任何自定义组件,此外,我在这个“家庭”项目中使用 Visual Studio 2012 RC,所以我不知道第 3 方组件是否兼容。
【问题讨论】:
-
您可以使用 OCR(光学字符识别)从您的 pdf 文件中提取文本。