【问题标题】:How can I get a vec file from a bin file?如何从 bin 文件中获取 vec 文件?
【发布时间】:2021-08-13 04:15:34
【问题描述】:

我正在尝试将我的模型与 fasttext unsupervised.py https://github.com/facebookresearch/MUSE 对齐。我用fasttext 训练了我的模型,我得到了二进制文件model.bin。当我使用 unsupervised.py 时,我得到了

error: ValueError: model.bin has wrong file format

怎么了?我必须有一个.vec 文件吗?如何获得?

【问题讨论】:

    标签: python alignment unsupervised-learning fasttext


    【解决方案1】:

    有关 .bin 和 .vec 文件之间的区别的信息,您可以阅读此question

    无论如何,MUSE 需要 .vec 文件

    如果您想将 .bin 文件转换为 .vec 文件,this answer 可能会帮到您。

    【讨论】:

      【解决方案2】:

      Puthon Gensim 包可以通过其FastText.load_facebook_model() method 加载 Facebook FastText .bin 模型:

      ft_model = FastText.load_facebook_model(path_to_bin)
      

      然后,使用 KeyedVectors' method .save_word2vec_format()with thebinary=False` option 将模型包含的 .wv 单词向量中的向量保存为纯文本 .vec 文件:

      ft_model.wv.save_word2vec_format('ft_model.vec')
      

      【讨论】:

        猜你喜欢
        • 2018-04-17
        • 2013-08-04
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2018-03-01
        • 1970-01-01
        相关资源
        最近更新 更多