【发布时间】:2014-11-09 12:27:11
【问题描述】:
NLTK 正则表达式适用于以下标签:
<DT>? <JJ>* <NN>*
有没有办法在正则表达式中包含单词?即:"<N> <such> <as> <N> <and> <N>"
【问题讨论】:
NLTK 正则表达式适用于以下标签:
<DT>? <JJ>* <NN>*
有没有办法在正则表达式中包含单词?即:"<N> <such> <as> <N> <and> <N>"
【问题讨论】:
我记得<DT>? <JJ>* <NN>* 是一个块模式。并且块模式使用tag_pattern2re_pattern()函数在内部转换为正则表达式:
>>> from nltk.chunk import tag_pattern2re_pattern
>>> tag_pattern2re_pattern('<DT>?<NN.*>+')
'(<(DT)>)?(<(NN[^\\{\\}<>]*)>)+'
然后你可以把你的话放在正则表达式结果中。
【讨论】: