【发布时间】:2015-03-16 09:52:37
【问题描述】:
使用 python 如何只检索标签 - 'NN'、'JJ' 等来自
('[', 'NN'),
("u'Tradus-Under", 'NN'),
("'", "''"),
(',', ','),
("u'Maintenance", 'JJ'),
("'", "''"),
(']', ':')
即。来自词性标注结果。
【问题讨论】:
-
我们如何识别标签?
使用 python 如何只检索标签 - 'NN'、'JJ' 等来自
('[', 'NN'),
("u'Tradus-Under", 'NN'),
("'", "''"),
(',', ','),
("u'Maintenance", 'JJ'),
("'", "''"),
(']', ':')
即。来自词性标注结果。
【问题讨论】:
假设这些元素在一个列表中(我称该列表为lst):
import string
lst = [
('[', 'NN'),
("u'Tradus-Under", 'NN'),
("'", "''"),
(',', ','),
("u'Maintenance", 'JJ'),
("'", "''"),
(']', ':')
]
tags = []
for _,poss_tag in lst:
if(len(poss_tag) == 2 and
poss_tag[0] == poss_tag[1] and
poss_tag[0] in string.ascii_letters):
tags.append(poss_tag)
print(tags)
输出:
['NN', 'NN', 'JJ']
如果你想要一个独特的集合,你可以将它反弹到一个集合并返回:
print(list(set(tags)))
输出:
['JJ', 'NN']
【讨论】: