【发布时间】:2011-10-03 08:00:27
【问题描述】:
我正在尝试使用 python 中的 nltk 模块将任何有两到五个名词顺序出现的实例分块。
这是我正在使用的代码:
parse_pattern = "Keyword: {< N>{2,5}}"
keyword_parser = nltk.RegexpParser(parse_pattern)
result = keyword_parser.parse(sentence)
我觉得这个位应该可以解决问题:Keyword: {< N>{2,5}}
我什至在《Natural Language Processing with Python》一书中找到了一个完全类似地使用上述位的示例:NOUNS: {< N.*>{4,}},作者解释说该位代码应该分块 4 个或更多名词。
但是,当我运行上述代码时出现错误:
ValueError: Illegal chunk pattern: {< N>{2,5}}
注意:我也尝试使用{< N.*>{2,5}} 进行上述操作(使用点星完全是因为上述书的作者这样做了),但没有运气。
任何关于如何分块两个或更多重复标记的帮助将不胜感激。
【问题讨论】: