【发布时间】:2020-02-15 00:48:21
【问题描述】:
我目前正在研究实体关系的东西,我发现很多论文都实施了远程监督来标记数据。我对远程监督的理解是,我们有一个既定的知识库 (KB),我们通过检查提取的实体对是否存在于 KB 中来进行“基于规则的标记”。如果实体对存在于 KB 中,则将其标记为正,否则将其标记为负。
我的问题是:
- 我是否正确理解了这个远程监督概念?
- 如果是,我不明白我们为什么要训练神经网络来对基于规则的系统进行分类?例如,如果将来我们得到包含实体的新句子,并且我们想检查它们是否相互关联,我们为什么不直接参考知识库呢?为什么我们要训练实体关系?
谢谢
【问题讨论】:
-
(2) 因为您可以预测看不见的文本位,基于规则的方法在这方面会失败(KB 查找等)
标签: machine-learning nlp data-science named-entity-recognition