【发布时间】:2013-06-13 15:45:17
【问题描述】:
我有大约 1800 个 PDF 文件,我必须从中提取 Flesch-Kincaid 年级分数。有人对我应该如何最好地解决这个问题有任何想法吗?我需要每个 PDF 的分数。
【问题讨论】:
-
分数在 PDF 文件中是如何显示的?是图片还是纯文本??
-
哦,我的意思是,我必须在 PDFS 上运行程序或算法本身才能获得分数。 PDF 只是必须从中生成分数的内容。有一个程序 Flesh.exe 可以对文档进行评分,但一次只能评分。
-
那是什么让配乐变得有血有肉?
-
我不知道你的意思是什么,但我需要的分数是年级分数,计算公式如下:(0.39×平均句长)+(11.8×平均音节)每个字)