【发布时间】:2021-09-02 21:55:54
【问题描述】:
来自tf.keras.layers.Embedding 上的文档:
input_dim:整数。词汇表的大小,即最大整数索引 + 1。
mask_zero:布尔值,输入值 0 是否是应被屏蔽的特殊“填充”值 出去。这在使用可能采用可变长度输入的循环层时很有用。如果这 为 True,则模型中的所有后续层都需要支持屏蔽,否则将出现异常 被抚养。如果将 mask_zero 设置为 True,则索引 0 不能用于 词汇表(input_dim 应该等于词汇表的大小 + 1)。
-
我正在阅读this answer,但我仍然感到困惑。如果我的词汇量为 n,但它们使用从
1到n的索引值进行编码(0 留作填充),那么 input_dim 是否等于n或n+1? -
如果输入用零填充,离开
mask_zero = False会有什么后果? -
如果
mask_zero = True,根据文档,我必须将第一个问题的答案加一?如果不这样做,预期的行为是什么?
【问题讨论】:
标签: tensorflow keras nlp