【发布时间】:2020-05-18 05:03:39
【问题描述】:
我正在寻找一种基于上下文检测单词含义的准确方法。例如。 “基地”一词可能有多种含义:底部、军事、主要部分等。
我知道 SpaCy 可以根据词性 (POS) 标签检测含义的差异,例如鸭子名词与动词,但在上面的示例中,此技术不起作用。 其他方法例如Word2Vec 适用于单个词嵌入(我认为),所以它也不好。
任何想法如何使用 Python 解决这个问题?
【问题讨论】:
我正在寻找一种基于上下文检测单词含义的准确方法。例如。 “基地”一词可能有多种含义:底部、军事、主要部分等。
我知道 SpaCy 可以根据词性 (POS) 标签检测含义的差异,例如鸭子名词与动词,但在上面的示例中,此技术不起作用。 其他方法例如Word2Vec 适用于单个词嵌入(我认为),所以它也不好。
任何想法如何使用 Python 解决这个问题?
【问题讨论】:
(1) 训练一个 LSTM 来预测序列中的下一个单词。到目前为止,RNN 的状态就是句子的表示。 (2) 预测词将考虑上下文,因此将是找到的实际词的消歧版本。 (3) 使用 BiLSTM 来改进预测,因此它还考虑了以下上下文。
【讨论】: