【问题标题】:Ask About The "default" Size of Vocabulary in Word2Vec in Deeplearning4j Library询问 Deeplearning4j 库中 Word2Vec 中词汇的“默认”大小
【发布时间】:2021-09-11 19:29:03
【问题描述】:

我目前正在学习这个库:来自 Deeplearning4j 的 Word2Vec (Homepage, Github)

以下是该方法的示例用法:

//build Word2Vec model
Word2Vec vec = new Word2Vec.Builder()
                .layerSize(100)
                .windowSize(5)
                .stopWords(stopList)
                .tokenizerFactory(t)
                .learningRate(0.025)
                .build();

我知道我可以用这种方法限制词汇量:

vec.limitVocabularySize(100) //limit the vocab size as 100

如果我想将词汇大小限制为 100,则上面的示例是命令

我的问题:
谁能告诉我 vocab 的 default 大小是多少(即,如果我没有设置限制)?

最好的,

【问题讨论】:

    标签: java word2vec deeplearning4j


    【解决方案1】:

    默认情况下没有限制。这意味着它会将找到的所有单词添加到词汇表中。

    另请注意,您链接到的示例已超过 4 年。建议你使用官方的例子:https://github.com/eclipse/deeplearning4j-examples

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-09-05
      • 1970-01-01
      • 2016-10-20
      • 1970-01-01
      • 2019-07-07
      • 2023-01-27
      • 1970-01-01
      • 2023-01-16
      相关资源
      最近更新 更多