【问题标题】:Convert .odt .doc .ods files to .txt files将 .odt .doc .ods 文件转换为 .txt 文件
【发布时间】:2010-12-06 13:19:48
【问题描述】:

我想将所有.odt.doc.xls.pdf文件转换为.txt文件。

我想使用 shell 脚本或 perl 脚本将这些文件转换为文本文件

【问题讨论】:

    标签: file-conversion


    【解决方案1】:

    有一个用于 odt 文件和类似文件的程序:

    odt2txt - 在 repos 中可用。

    【讨论】:

    • 这是一个非常轻量级的程序,并且做得很好。谢谢!
    【解决方案2】:
    $ unoconv --format=txt document1.odt
    

    应该产生document1.txt。

    【讨论】:

    【解决方案3】:

    OpenOffice 有一个内置的文档转换器,能够处理多种格式 - 看看 unoconv:http://dag.wieers.com/home-made/unoconv/

    话虽如此,过去我在让它工作时遇到了一些麻烦 - 如果您遇到麻烦,请查看 AbiWord(另一个开源文字处理器)的类似程序。

    【讨论】:

      【解决方案4】:

      对于word文档,你可以试试antiword,至少在linux上是这样。它是一个命令行实用程序,它以 word 文档作为参数,并将该文档中的文本(尽其所能)输出到标准输出。也许您也可以指定一个输出文件。我不记得它是如何工作的细节。我有一段时间没有使用它了。不确定它是否可以处理面向对象的文档。

      【讨论】:

        【解决方案5】:

        当然可以做到这一点,尽管 OO 项目及其文档有些奇怪且难以理解,这使得此类事情难以研究和遵循。但是,OO 能够转换所有这些类型,而不仅仅是 OO 原生类型,并且可以通过两种不同形式的自动控制来实现。

        这是两种通用方法。

        1. 您可以启动 OO 并告诉它执行一个宏,该宏会为您完成给定文件的这项工作。然后你只需要编写宏和脚本来循环你的文件。语法类似于

          $ oowriter -headless 文件名宏://dir/Standard.Module1.sMySub

        2. OO 的另一件事是网络 API。这是基于称为 UNO 的东西。

          $ oowriter -accept=接受字符串

          Notifies  the  OpenOffice.org software that upon the creation of
          "UNO Acceptor Threads", a "UNO Accept String" will be used.
          

        您将需要某种客户端库。我认为他们至少有一个用于 Python 的。使用这项技术,Python 程序或其他带有 OO 客户端库的脚本语言可以驱动程序并转换所有文件。 OO既然读MSO,应该都能做到。

        【讨论】:

        • 嗨,我找不到你。能具体点吗??请帮助我,因为我需要尽快将 odt 文件转换为 txtx 文件
        • 好的,我已经更新了我的答案以使事情更清楚。今天晚些时候我会在这里添加更多内容,6 或 12 小时后回来...
        【解决方案6】:

        在 LibreOffice 中打开文件。单击“文件”,“另存为”向下滚动以找到文本选项。单击它,它将保存为文本文件。

        仅供参考,我有一个大小为 339.2 KB 的 *.ODT 文件。当我另存为文本时,文件的大小缩小到只有 5.0 KB。将文件另存为文本文件的另一个原因。

        【讨论】:

          【解决方案7】:

          对于 Microsoft 格式,请查看 wvWare tools

          【讨论】:

            【解决方案8】:

            在 libre office 中正常打开 .ods 文件

            突出显示要转换的文本

            打开一个终端

            运行 vi

            按“i”进入插入模式

            按 ctrl-shift-v

            完成!

            需要一些格式吗?

            将文件另存为

            离开vi

            运行:

            $猫 |列>文件名2

            这在运行 KDE 的 opensuse 中有效

            如果你愿意,用“kwrite”代替“vi”

            【讨论】:

              猜你喜欢
              • 2011-01-25
              • 1970-01-01
              • 1970-01-01
              • 1970-01-01
              • 1970-01-01
              • 2012-04-14
              • 1970-01-01
              • 2018-02-02
              • 2019-08-29
              相关资源
              最近更新 更多