【发布时间】:2018-04-05 11:30:48
【问题描述】:
我想使用 GloVe 为文档构建词嵌入。我知道如何获取单个单词(unigrams)的向量嵌入,如下所示(对于他们的示例文本文档)。
$ git clone http://github.com/stanfordnlp/glove
$ cd glove && make
$ ./demo.sh
现在,我想获得二元组的向量嵌入。例如;
- “New york” -> 代替“New”和“york”
- “机器学习”->而不是“机器”和“学习”
是否可以在 GloVe 中进行?如果是,怎么做?
【问题讨论】:
-
使用来源。
-
请注意,在绝对不平凡且正在进行的研究主题中,从单个单词的嵌入开始获取单词组合的嵌入。
标签: nlp stanford-nlp data-mining gensim word-embedding