【问题标题】:NLP techniques for evaluating grammatical correctness?用于评估语法正确性的 NLP 技术?
【发布时间】:2025-07-24 05:45:01
【问题描述】:

我很好奇应用 NLP 通过分析某人撰写的文本来预测/评估某人的教育水平(或对正确语法、拼写等的遵守情况)。

类似于:f(t) = s 其中 t 是一个文本,s 是某个分数,用于评估该文本的语法正确性。

存在吗?我不知道如何搜索它。如果是这样,我想要一些相关论文或算法的参考资料。

【问题讨论】:

  • 从 Flesch/Flesch-Kincaid 等开始。您可以考虑拼写和语法,但不会对更一般的可读性得分增加太多。

标签: machine-learning nlp


【解决方案1】:

它不存在。无论如何,“语法正确性”是一个模糊的概念,因为没有任何给定语言的完整语法描述。此外,我们都会说和写我们语言的不同变体,这是单一语法无法捕捉到的。一种语言基本上是其说话者产生的所有单个变体的结合。

撇开这些语言哲学问题不谈,即使是一种语言的单一变体,也没有可以用作基准的正式语法。我想你能做的最接近的事情是提出一些启发式和简单的规则(我假设商业语法检查器使用),例如检查 reads 总是出现在第三人称单数名词之后。如果您有足够数量的此类启发式方法,您可以了解给定文本是否符合语法,根据语法性等同于不违反您编码的规则的定义。

但是,语言非常灵活,很难在规则中捕捉到。有时一个句子可能听起来像一个错误,但在给定的上下文中它很好。如果这很容易,早就有人做过了,小学老师可以把精力集中在教基本语法以外的任务上……

你可能很容易捕捉到一些“错误”,但我不想猜测你会得到什么报道;会有很多你无法轻易捕捉到的问题。

【讨论】:

    最近更新 更多