【发布时间】:2014-01-13 05:31:43
【问题描述】:
我正在使用 stanford 解析器进行 POS 标记,我想从标记器所做的标记中获取名词、形容词动词、副词的单独同义词集。 例如
如果我的输入查询是
“恒河是印度最大的河流,人们曾将其视为神”
标注器的输出是:
"恒河/NNP 是/VBZ 印度/NNP 的/POS 最大/JJS 河/NN 和/CC 人/NNS 使用/VBN 到/TO 考虑/VB 它/PRP 作为/IN a/DT神/NNP”
从这里我想把名词、动词、副词和形容词分开,并想分别得到对应的同义词。
如何使用 JAVA 编程做到这一点?
【问题讨论】:
-
如果
/后面的两个字母表示动词或名词,可以试试indexOf("/VB")、indexOf("/NN")等 -
indexOf("/VB") 是什么意思?它的输出是什么?
标签: java parsing stanford-nlp wordnet