【问题标题】:ELMo - How to train trainable parametersELMo - 如何训练可训练参数
【发布时间】:2018-06-23 09:39:14
【问题描述】:

我是 tensorflow-hub 的新手,遇到了 ELMo 模型 (https://www.tensorflow.org/hub/modules/google/elmo/2)。

根据原始论文,ELMo 表示是隐藏状态激活的加权平均值,这些权重可以根据手头的任务(即特定任务)进行训练。正如预期的那样,当我使用 tf.trainable_variables() 时,我可以看到 4 个可训练参数。如何在 tensorflow 中准确训练这些变量?

他们只是提到这些权重是可训练的。但谁应该训练它? Me 还是 ELMo 模型本身训练呢?论文似乎建议我应该训练它。如果是这样,我如何在 tensorflow 中训练它?

【问题讨论】:

    标签: python tensorflow tensorflow-hub elmo


    【解决方案1】:

    您可以先将一个模块导入您的模型,并设置 trainable=True,然后像其他任何 TF 模型一样使用train 模型。在此训练过程中,模型导入的部分模块的权重也将被训练。您也可以使用this tutorial 作为一个很好的起点,只需将 nnlm 嵌入替换为 ELMo。

    【讨论】:

      猜你喜欢
      • 2023-03-20
      • 2019-08-15
      • 1970-01-01
      • 2020-02-29
      • 2021-02-18
      • 2014-07-22
      • 2022-07-21
      • 2016-09-16
      • 2022-11-17
      相关资源
      最近更新 更多