【发布时间】:2021-08-18 14:21:57
【问题描述】:
我意识到存在 FastText here 的原始实现,您可以使用 fasttext.train_unsupervised 来生成词向量(参见 this link 作为示例)。然而,事实证明 gensim 也支持 fasttext,其 API 类似于 word2vec。 See example here.
我想知道这两种实现之间是否有区别?文档不清楚但它们是否都模仿了论文Enriching Word Vectors with Subword Information?如果是,那么为什么要使用 gensim 的 fasttext 而不是 fasttext?
【问题讨论】: