斯坦福解析器 - 因子模型和 PCFG答案

【问题标题】：Stanford Parser - Factored model and PCFG斯坦福解析器 - 因子模型和 PCFG
【发布时间】：2015-06-09 03:43:20
【问题描述】：

stanford 解析器的因式分解模型和 PCFG 模型有什么区别？（在理论工作和数学方面）

【问题讨论】：

标签： parsing nlp stanford-nlp sentiment-analysis text-analysis

【解决方案1】：

This FAQ answer 用很长的一段话解释了不同之处。相关部分引述如下：

你能解释一下不同的解析器吗？

这个答案是针对英语的。尽管某些语言中缺少某些组件，但它主要适用于其他语言。文件englishPCFG.ser.gz 仅包含一个未词汇化的 PCFG 语法。它基本上就是 ACL 2003 Accurate Unlexicalized Parsing 论文中描述的解析器。

... 文件englishFactored.ser.gz 包含两个语法并导致系统运行三个解析器。它首先运行（更简单的）PCFG 解析器，然后运行无类型依赖解析器，然后运行第三个解析器，该解析器通过产品模型在其他两个解析器中找到具有最佳联合得分的解析。这在 NIPS Fast Exact Inference 论文中有所描述。

... 对于英语，虽然语法和解析方法不同，但englishPCFG.ser.gz 和englishFactored.ser.gz 的平均质量相似，所以很多人选择更快的englishPCFG.ser.gz，尽管englishFactored.ser.gz 有时会更好，因为它确实包括词汇化。对于其他语言，因子模型比 PCFG 模型要好得多，并且是人们通常使用的。

有the main parser page上引用的论文的链接。

【讨论】：

感谢 Jon 的简单解释