【发布时间】:2018-12-01 09:23:11
【问题描述】:
我正在看这个 pytorch 入门教程:
zero_grad() 函数被用于将梯度归零,这意味着它以小批量运行,这是一个正确的假设吗?如果是,批量大小在哪里定义??
我为nn.conv2d找到了以下内容:
For example, nn.Conv2d will take in a 4D Tensor of nSamples x nChannels x Height x Width.
在那种情况下nSamples 是批量大小?
但是如何为nn.Linear 层指定批量大小?当你加载数据时,你决定你的小批量是什么还是什么?
我在这里做了一些可能完全不正确的假设,如果我错了,请纠正我。 谢谢!
【问题讨论】:
标签: deep-learning pytorch