【问题标题】:Mixing words and PoS tags in NLTK parser grammars在 NLTK 解析器语法中混合单词和 PoS 标签
【发布时间】:2012-10-06 00:27:44
【问题描述】:

我已经使用 NLTK 有一段时间了,现在正在为特殊分块定义自定义解析器语法。我遵循http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html 中的描述,但我感兴趣的内容与本章中描述的内容略有不同。例如,在示例 7.10 中,对动词阶段使用以下内容: 副总裁:{+$} 我只想匹配使用一个特定动词而不是任何动词的句子。就像是: 副总裁:{go+$}

换句话说,我想匹配实际单词而不是单词的 PoS 标签,并在正则表达式中混合匹配实际单词和 PoS 标签。

这可能吗?

【问题讨论】:

  • 也许您可以预处理语料库以将“go”的词性标签从“VB”更改为“GO”,然后使用标准设置?

标签: python python-2.7 nlp nltk


【解决方案1】:

nltk pos-tagger 生成的标准 PoS 标签不适用。

如果你需要为不同的动词做语法,一个有用的技巧可能是预处理标签并将标记附加到所有动词的标签上。因此,您可以使用看起来像 VP: {+$}

的正则表达式字符串

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-06-06
    • 2012-11-26
    • 1970-01-01
    • 1970-01-01
    • 2017-01-21
    • 1970-01-01
    相关资源
    最近更新 更多