【发布时间】:2020-02-07 07:31:02
【问题描述】:
我的目标是读取上传的文档并提取某些值,例如浮点数“1.20, 3.9”、文本。 我尝试了几个库,但似乎没有任何工作可以完成。
此外,文件将包含类似结构的表格,大部分时间也会吐出边框的垂直线。
想到的是一些繁重的正则表达式解析逻辑......
有人有建议的解决方案吗?
【问题讨论】:
-
也许您应该使用 CloudConvert 等在线工具将 doc/docx 文件(无法在 PHP 中解析)转换为简单的 TXT 文件(使用正则表达式等轻松解析)。有一个简单的 API 可以访问 CC 功能,我正在使用它。很遗憾你必须用 doc/docx 文档(不是文本格式)来做事