【问题标题】:how to convert .docx and .pdf to .txt file如何将 .docx 和 .pdf 转换为 .txt 文件
【发布时间】:2017-12-18 16:21:52
【问题描述】:

我正在开发一个需要将 .docx 和 .pdf 文件转换为 .txt 的应用程序 具有基本格式的文件。我在互联网上搜索了它,但找不到任何免费的第三方 dll。任何人都可以建议我最好的方法和一些 dll 参考。

提前致谢

【问题讨论】:

    标签: vb.net docx


    【解决方案1】:

    http://support.microsoft.com/kb/316383 很好地描述了您希望如何处理 .docx 文件。 http://visualbasic.about.com/od/quicktips/qt/disppdf.htm 描述相同,但使用 .pdf 文件。

    将文件读入代码后,使用 VB.NET 的内置文件写入功能输出到 txt 文件。

    【讨论】:

    • 感谢您的回复。但我已经有一个 docx 文件列表。如何在 oDoc 对象中加载这些
    • oDoc = oWord.Documents.Add("C:\Temp\WordTest.docx")
    【解决方案2】:

    下面的代码将为您处理这项工作。这是我写给大老板的东西哈哈。我希望它有所帮助。该代码将工作表中的第一个单元格读取为docx文件所在的文件夹,然后将它们逐个转换为txt文件并保存在同一文件夹中。

    Const wdFormatText = 2
    
    If Not Len(Cells(1, "A").Value) > 0 Or Dir(Cells(1, "A").Value, vbDirectory) = "" Then
        MsgBox ("Invalid Folder")
        Exit Sub
    End If
    
    Dim StrFile As String
    
        StrFile = Dir(Cells(1, "A").Value & "\*.docx")
        Do While Len(StrFile) > 0
            Set objWord = CreateObject("Word.Application")
            Set objDoc = objWord.Documents.Open(Cells(1, "A").Value & "\" & StrFile, False, True)
            objDoc.SaveAs Cells(1, "A").Value & "\" & StrFile & ".txt", wdFormatText
            objWord.Quit
            StrFile = Dir
        Loop
    

    【讨论】:

      猜你喜欢
      • 2014-04-20
      • 1970-01-01
      • 2020-08-14
      • 2021-04-23
      • 2018-08-13
      • 2020-01-08
      • 2017-04-14
      • 2010-12-02
      • 2020-02-07
      相关资源
      最近更新 更多