【发布时间】:2020-03-05 08:16:57
【问题描述】:
我是 NLP 的新手,并试图解决词性标记。我有一个带有词性的句子,我想写成一行的整个句子的('word','pos_tag')。
1. aImIroawi/ADJ TIOIna/N ::/PUN
2. qIdImi/PRE bIzuHI/ADJ OametatI/N "/PUN aImIroawi/ADJ sInIkIlIna/N bIganEnI/N
3. weyI/CON IkeyI/ADJ menafIsIti/N iyu/V_AUX zImexII/V_REL "/PUN zIbIlI/V_REL 4. gIguyI/ADJ ameleKaKIta/N neyIru/V_GER ::/PUN
这是我的数据
for line in corpus:
lene =line.split()
sentence.append(lene)
#print(sentence)
#print (lene)
for word in lene:
w,tag = word.split('/')
words.append(w)
tags.append(tag)
#print(len(lene))
for line in corpus:
onesentence=line.split()
print(len(onesentence))
for elem in onesentence:
for i in range(len(onesentence)):
elem = words[i],tags[i]
print(elem)
('qIdImi', 'PRE')
('bIzuHI', 'ADJ')
('OametatI', 'N')
('"', 'PUN')
('aImIroawi', 'ADJ')
('sInIkIlIna', 'N')
('bIganEnI', 'N')
('weyI', 'CON')
('IkeyI', 'ADJ')
在上面它是我得到的结果,但我想在数组中的列表中为一个句子写下所有具有相应 pos 的单词。喜欢
[ [('aImIroawi', 'ADJ'), ('TIOIna','N'), ('::','PUN')],[('qIdImi','PRE'), ('bIzuHI','ADJ'),('OametatI','N'), .....]]
【问题讨论】:
标签: python string list replace