【发布时间】:2019-01-14 06:04:54
【问题描述】:
我正在阅读关于神经网络的 tensorflow 教程,我遇到了架构部分,这有点令人困惑。有人能解释一下为什么他在这段代码中使用了以下设置
# input shape is the vocabulary count used for the movie reviews
(10,000 words) vocab_size = 10000 model = keras.Sequential() model.add(keras.layers.Embedding(vocab_size, 16)) model.add(keras.layers.GlobalAveragePooling1D()) model.add(keras.layers.Dense(16, activation=tf.nn.relu)) model.add(keras.layers.Dense(1, activation=tf.nn.sigmoid)) model.summary()
词汇大小? 嵌入的值为 16? 以及单位的选择,我得到了最后一个密集层背后的直觉,因为它是一个二元分类(1),但为什么第二层有 16 个单位? 嵌入中的 16 个单元和第一个密集层中的 16 个单元是否相关?他们应该是平等的吗?
如果有人也能解释一下这一段
第一层是嵌入层。该层采用整数编码的词汇表并查找每个单词索引的嵌入向量。这些向量是作为模型训练来学习的。向量向输出数组添加一个维度。生成的维度是:(批次、序列、嵌入)。
【问题讨论】:
标签: tensorflow machine-learning