【发布时间】:2022-10-17 11:49:12
【问题描述】:
我正在尝试使用IS_DIGIT 和LIKE_NUM 属性提取一些数字,但对于像我这样的初学者来说,这似乎有点奇怪。
只有当 5 个字符串以 M、G、T 结尾时,匹配器才能检测到数字。如果是其他字符,则IS_DIGIT 和LIKE_NUM 属性无法检测到。我在这里想念什么?
nlp = spacy.load("en_core_web_sm")
matcher = Matcher(nlp.vocab)
pattern = [{'LIKE_NUM': True}]
matcher.add("DIGIT",[pattern])
doc = nlp("1231M 1232G 1233H 1234J 1235V 1236T")
matches = matcher(doc, as_spans=True)
for span in matches:
print(span.text, span.label_)
# prints only 1231, 1232 and 1236
【问题讨论】:
标签: spacy