【发布时间】:2016-08-25 00:48:58
【问题描述】:
我正在努力在 Python 中使用正则表达式实现否定标记,例如 Christopher Potts 的 sentiment analysis tutorial。
取自他的教程的否定定义是:
(?:
^(?:never|no|nothing|nowhere|noone|none|not|
havent|hasnt|hadnt|cant|couldnt|shouldnt|
wont|wouldnt|dont|doesnt|didnt|isnt|arent|aint
)$
)
|
n't
而从句级标点的定义是:
^[.:;!?]$
这个想法是捕获否定和子句级标点之间的单词,然后修改它们以表明它们被否定,例如:
No one enjoys it.
应该变成这样:
No one_NEG enjoys_NEG it_NEG.
任何建议将不胜感激。
【问题讨论】: