【问题标题】:What is the meaning of this NLP notation?这个 NLP 符号的含义是什么?
【发布时间】:2014-04-28 13:00:43
【问题描述】:

我正在学习 NLP 以尝试在语料库上进行关系提取。我找到了these 幻灯片,并试图解析高维特征向量的符号(如下所示)。

在哪里

如何将最上面的等式变成英文句子?对于每个输入文本单元,x;对于每个可能的特征,y - 特征 x is-a y 可以用特征向量表示?我习惯于看到笛卡尔积表示法,我习惯于看到函数表示法,我习惯于看到集合构建器表示法。但是那行中有太多不熟悉的事情,我无法理解它所说的内容。冒号是什么意思?箭头是什么意思?

【问题讨论】:

  • 我完全理解你的感受。反应应该是“IKR”

标签: machine-learning nlp


【解决方案1】:

这意味着 f 是一个函数,它接受一个输入和一个输出并产生一个向量。在这种情况下,输入通常是一个词序列,而输出是该词序列的候选标签——例如一系列词性标签或解析树。问题中链接的 Ryan McDonald 幻灯片的第 8 张幻灯片中有一些示例。

McDonald 也提出了这一点,但我会在这里重复一遍:在某些情况下,我们可以完全从输入序列(不参考输出)生成特征向量。例如,如果我们要标记句子“F is a function”的单词 2,并且我们的特征映射仅包括当前单词和前一个单词,我们会将“F”作为前一个单词,“is”作为当前单词。但在某些情况下(特别是“结构化预测”),我们还希望包含取决于候选标签的特征 - 可能是整个输入上的标签序列(请注意,这通常会导致 巨大的 特征空间)。

另外一个注意事项:McDonald 的映射是到一个实值向量 (R^n),但是在 NLP 中,我们经常发现指标特征就足够了,所以很多系统使用位向量来代替(仍然是一个非常高维的空间)。形式没有改变(只有映射函数 f),但简化的假设通常会提高权重向量存储和点积实现的效率。

【讨论】:

  • 感谢您的回复。我对冒号的含义有点模糊。以及箭头的含义。你能解释一下这些符号吗?
  • 我相信冒号明确地将函数(f)的名称与域(输入/输出)分开。箭头表示函数从输入域到输出域的映射——在这种情况下,输入是 X 和 Y 的叉积,输出是 m 维的实向量)。这很简单,我敢肯定它在数学上并不严格。但希望它能传达这个想法。
【解决方案2】:

这是function notation。它说有一个函数 f,其域 = X x Y 和一个域 = R^n——其中 X 是一些输入文本,Y 是一些标签。

换句话说,它映射所有可能的文本和标签组合,并将它们映射到某个 n 维空间中。

【讨论】:

    猜你喜欢
    • 2016-04-11
    • 2020-05-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-06-26
    • 1970-01-01
    • 2010-11-23
    相关资源
    最近更新 更多