【发布时间】:2014-03-27 10:14:05
【问题描述】:
我在 Linux 服务器上,我需要使用 PHP 将 MS Word 97-2003 .doc 格式转换为纯文本 .txt 文件
我已经尝试过这个解决方案:
How to extract text from word file .doc,docx,.xlsx,.pptx php
Extract text from doc and docx
但两者都适用于 .docx 格式。
问题是当我转换文件时,我在文本的末尾得到了废字符。 我不需要的字符的长度取决于文件的长度。 此外,如果文件有点长,它可能会被截断。
有什么简单的方法可以转换吗?
【问题讨论】:
-
好吧,我的意思是不使用 Apache POI 或其他 Java 东西或 Antiword 等外部应用程序...
-
你总是需要一个库来做这个,因为 PHP 本身不支持这个