【发布时间】:2012-01-02 13:09:05
【问题描述】:
NLTK 的 chunk parser 的正则表达式可以匹配 POS 标签,但是它们也能匹配特定的单词吗?
所以,假设我想用一个名词后跟动词“left”(称之为模式 L)来分块任何结构。例如,句子“the\DT dog\NN left\VB”应该被分块为
(S (DT the) (L (NN dog) (VB left))),但句子“the\DT dog\NN slept\VB”根本不会被分块。
我找不到任何关于分块正则表达式语法的文档,而且我看到的所有示例都只匹配 POS 标签。
【问题讨论】: