【发布时间】:2020-12-15 16:32:56
【问题描述】:
我在寻找注释数据的正确方法时遇到了一些麻烦。我正在处理与实验室测试相关的文本,我正在使用以下标签:
1) 测试规范(例如电压、长度……)
2) 测试对象(例如电池、偷梁...)
3) 测试值(例如 5 V;5 m...)
我们来看这个例句:
电池电压应为 5 V。
我会这样注释这些句子:
The
battery voltage (test specification)
should
be
5 V (Test value)
.
但是,如果这句话看起来像这样:
电池电压应为 5 V。
我会使用以下注释:
The
voltage (Test specification)
of
the
battery (Test object)
should
be
5 V (Test value)
.
有没有人在注释数据方面有经验来解释这是否是正确的方法?或者我应该在他的第一个示例中使用 battery 的测试对象标签吗?或者我应该将第二个示例电池电压中的标签组合为测试规范?
我正在对数据进行注释以执行信息提取。
感谢您的帮助!
【问题讨论】:
标签: spacy named-entity-recognition information-extraction