【问题标题】:How to programmatically convert a pdf file to a text file?如何以编程方式将pdf文件转换为文本文件?
【发布时间】:2012-07-08 03:04:25
【问题描述】:

我需要加载一个 pdf 文件,然后以编程方式将其转换为文本文件,以便对其进行解析。

另一种可能性是执行文件(执行 Adob​​e Reader,以 pdf 文件作为参数),然后向其“发送密钥”以将文件保存为文本。

但是,我不希望这样做(打开文件),但如果这是唯一的解决方案,我会这样做。但是:甚至可以在 C#/WPF 中执行“发送密钥”之类的功能吗?

注意:我不想购买任何自定义组件,此外,我在这个“家庭”项目中使用 Visual Studio 2012 RC,所以我不知道第 3 方组件是否兼容。

【问题讨论】:

  • 您可以使用 OCR(光学字符识别)从您的 pdf 文件中提取文本。

标签: c# wpf parsing pdf


【解决方案1】:

如果您希望将此应用程序部署给其他用户,我倾向于使用众多可用的 PDF 库之一并通过代码处理 PDF,而不是尝试使用 Adob​​e Reader。如果您的用户没有安装 Adob​​e Reader,它将消除问题。

尝试从以下链接开始,了解一些图书馆创意。

https://stackoverflow.com/questions/373926/lightweight-open-source-pdf-library-in-c

C# PDF Control & Library

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-05-06
    • 2013-12-11
    • 2012-07-11
    • 2011-03-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-01-30
    相关资源
    最近更新 更多