【发布时间】:2010-12-30 14:38:25
【问题描述】:
如何从上传的 PDF、Doc、Xls、Csv 等文件中计算字数。使用 PHP、Zend 框架或基于 CLI 的 Java 触发器?
【问题讨论】:
-
csv 很简单。所以你想要工具来逆向工程 pdf、doc、xls...?
-
以编程方式解析 PDF 并非易事。最好使用 3rd 方 pdf 阅读器,即使在字序方面也有问题,但如果你只需要字数统计,它们非常有效。 PDF 的布局类似于拼贴画。线没有严格的定义。对你来说看起来像一条完美的直线,在几何上可能是一团糟。
-
$wc filename.pdf 或任何给出这个> 46 265 13025 file.odt
-
@pouncep,是的,在 linux 中我有这个,但这是来自终端示例的错误计数器:$ wc filename.pdf or filename.doc or filename.csv or filename.xls
-
@P.Brian.Mackey: 0.o 哪一个对 ZF 和 Java 友好?没有开源框架或库吗?
标签: java php zend-framework