【发布时间】:2021-04-07 10:47:41
【问题描述】:
我有一个理论上是 CoNLL 格式的 txt 文件。像这样:
a O
nivel B-INDC
de O
la O
columna B-ANAT
anterior I-ANAT
del I-ANAT
acetabulo I-ANAT
existiendo O
minimos B-INDC
cambios B-INDC
edematosos B-DISO
en O
la O
medular B-ANAT
(...)
我需要将其转换为句子列表,但我没有找到方法。我尝试使用 conllu 库的解析器:
from conllu import parse
sentences = parse("location/train_data.txt")
但他们给出了错误:ParseException: Invalid line format, line must contain either tabs or two spaces.
我怎样才能得到这个?
["a nivel de la columna anterior del acetabulo", "existiendo minimos cambios edematosos en la medular", ...]
谢谢
【问题讨论】: