【问题标题】:retrieving tags from result of POS tagging从 POS 标记结果中检索标记
【发布时间】:2015-03-16 09:52:37
【问题描述】:

使用 python 如何只检索标签 - 'NN'、'JJ' 等来自

('[', 'NN'), 
("u'Tradus-Under", 'NN'), 
("'", "''"), 
(',', ','), 
("u'Maintenance", 'JJ'), 
("'", "''"), 
(']', ':')

即。来自词性标注结果。

【问题讨论】:

  • 我们如何识别标签?

标签: python tagging


【解决方案1】:

假设这些元素在一个列表中(我称该列表为lst):

import string
lst = [
    ('[', 'NN'),
    ("u'Tradus-Under", 'NN'),
    ("'", "''"),
    (',', ','),
    ("u'Maintenance", 'JJ'),
    ("'", "''"),
    (']', ':')
]

tags = []
for _,poss_tag in lst:
    if(len(poss_tag) == 2 and 
           poss_tag[0] == poss_tag[1] and 
           poss_tag[0] in string.ascii_letters):
        tags.append(poss_tag)

print(tags)

输出:

['NN', 'NN', 'JJ']

如果你想要一个独特的集合,你可以将它反弹到一个集合并返回:

print(list(set(tags)))

输出:

['JJ', 'NN']

【讨论】:

    猜你喜欢
    • 2016-10-30
    • 2016-07-02
    • 1970-01-01
    • 2013-08-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多