【发布时间】:2020-09-25 15:39:22
【问题描述】:
我有一个经过量化的预训练嵌入文件,采用 .ftz 格式。我需要它来查找单词,找到最近的邻居。但我找不到任何可以做到这一点的工具包。 FastText 可以加载嵌入文件,但无法查找最近的邻居,Gensim 可以查找最近的邻居,但无法加载模型...
还是我没有找到合适的功能?
谢谢!
【问题讨论】:
-
如果我理解正确,Facebook 的 FastText 仅为其
supervised-mode 模型提供“量化”优化,Gensim 目前不支持使用此类模型。所以:至少就 Gensim 而言,你只是遇到了一个已知的限制。 (Gensim 可能比支持监督训练更容易地支持 加载来自supervised-mode 模型的词向量......所以如果你报告你遇到的错误,它可能会建议一种解决方法或方法以 Gensim 可以读取的格式(例如纯文本格式)导出词向量。) -
@gojomo:这应该是一个答案,
标签: python gensim word-embedding fasttext