【发布时间】:2021-08-17 22:56:50
【问题描述】:
我想知道这个内存带宽量是否正确。我有一个 NVDIA RTX 3090,理论上,它的带宽应该在 936.2 GB/s 左右。然而,当使用 TensorFlow 时,它似乎明显更低。有什么限制还是应该是这样? 我目前的总线接口是 PCIe x16 4.0
【问题讨论】:
标签: python tensorflow memory gpu hardware
我想知道这个内存带宽量是否正确。我有一个 NVDIA RTX 3090,理论上,它的带宽应该在 936.2 GB/s 左右。然而,当使用 TensorFlow 时,它似乎明显更低。有什么限制还是应该是这样? 我目前的总线接口是 PCIe x16 4.0
【问题讨论】:
标签: python tensorflow memory gpu hardware
871.81 吉字节 (GiB) ~= 936.1 吉字节 (GB)
所以 Tensorflow 报告的带宽与卡的官方规格大致相同(0.1 GB/s 差异)。我怀疑 0.1 的差异只是某处的舍入或精度损失。
【讨论】: