【问题标题】:Convert doc to txt将文档转换为txt
【发布时间】:2014-03-27 10:14:05
【问题描述】:

我在 Linux 服务器上,我需要使用 PHP 将 MS Word 97-2003 .doc 格式转换为纯文本 .txt 文件

我已经尝试过这个解决方案:

How to extract text from word file .doc,docx,.xlsx,.pptx php

Extract text from doc and docx

但两者都适用于 .docx 格式。

问题是当我转换文件时,我在文本的末尾得到了废字符。 我不需要的字符的长度取决于文件的长度。 此外,如果文件有点长,它可能会被截断。

有什么简单的方法可以转换吗?

【问题讨论】:

  • 好吧,我的意思是不使用 Apache POI 或其他 Java 东西或 Antiword 等外部​​应用程序...
  • 你总是需要一个库来做这个,因为 PHP 本身不支持这个

标签: php ms-word doc


【解决方案1】:

我终于开始使用以下解决方案,启动 Antiword:

private function doc() {
    $file = escapeshellarg($this->filename);
    $text = `/usr/sbin/antiword -w 0 $file`;
    return html_entity_decode(utf8_encode(trim($text)));
}

【讨论】:

    【解决方案2】:

    我回答我自己的问题。 经过一番搜索,我从 iFile 中找到了这个库: http://www.isapp.it/ifile/it/APIDocument_v1.2/ifile/adapter-helpers/_adapter---helpers---class.doc2txt.php.html

    它实际上对 .doc 和 .rtf 都非常有效

    【讨论】:

    • 放置链接不是一个好的解决方案,请添加你是如何做到的
    • 链接失效
    猜你喜欢
    • 1970-01-01
    • 2020-12-20
    • 2021-10-24
    • 2021-12-24
    • 2017-02-09
    • 2017-09-23
    • 2014-06-11
    • 1970-01-01
    • 2019-08-05
    相关资源
    最近更新 更多