【发布时间】:2023-05-01 22:59:02
【问题描述】:
我是python和TensorFlow的新手,最近几天在学习“MNIST For ML Beginners”时遇到了一个问题(https://www.tensorflow.org/get_started/mnist/beginners)。
在本教程中,我们使用y = tf.nn.softmax(tf.matmul(X, W) + b) 来获取我们的输出。
我的问题是,例如,X 是 [100,784] 矩阵,W 是 [784,10] 矩阵,b 是 [10] 张量(像 [10,1] 矩阵?),在我们调用之后tf.matmul(X, W) 我们将得到一个 [100,10] 矩阵。这是我的问题,[100,10] 矩阵如何在这里添加 b[10] 张量?这对我来说没有任何意义。
我知道为什么会有偏见,也知道为什么需要添加偏见。但我只是不知道“+”运算符在这个问题中是如何工作的。
【问题讨论】:
-
在 numpy 中查看广播
-
(10,)不是(10, 1)。向量不会自动成为矩阵、行向量或列向量。它只是一个向量。
标签: matrix tensorflow mnist softmax tensor