【发布时间】:2015-06-17 00:28:26
【问题描述】:
根据我的理解,远程监督是指定段落中的单个单词(通常是句子)试图传达的概念的过程。
例如,一个数据库维护结构化关系concerns( NLP, this sentence).
我们的远程监督系统会将以下句子作为输入:"This is a sentence about NLP."
它会根据这个句子识别实体,因为作为预处理步骤,该句子将通过命名实体识别器NLP 和this sentence。
由于我们的数据库中有 NLP 和 this sentence 通过 concern(s) 的键相关联,因此它将输入句子识别为表达关系 Concerns(NLP, this sentence)。
我的问题有两个:
1) 那有什么用?是不是以后我们的系统可能会看到诸如That sentence is about OPP之类的“狂野”中的句子并意识到它看到了与之前相似的东西,从而仅基于单词/单个标记来实现concerns(OPP, that sentence).这样的新关系?
2) 是否考虑了句子的实际单词?例如,动词“是”和副词“关于”,意识到(通过 WordNet 或其他一些下位词系统)这在某种程度上类似于高阶概念“关注”?
是否有人有一些代码用于生成我可以查看的远程监督系统,即交叉引用 KB(如 Freebase)和语料库(如 NYTimes)并生成远程监督数据库的系统?我认为这将大大有助于澄清我对远程监督的概念。
【问题讨论】:
标签: nlp stanford-nlp supervised-learning unsupervised-learning