【问题标题】:How to get memory bandwidth from memory clock/memory speed如何从内存时钟/内存速度中获取内存带宽
【发布时间】:2013-02-09 22:36:21
【问题描述】:

仅供参考,这是我从 Nvidia 获得的规格

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications

请注意,内存速度/内存时钟在他们的网站上是相同的,都以 Gbps 为单位。

谢谢!

【问题讨论】:

    标签: gpu memory-bandwidth


    【解决方案1】:

    Titan 有 384 位总线,而 GTX 680 只有 256,因此内存带宽增加了 50%(假设时钟和延迟相同。

    编辑:我将尝试进一步解释整个概念:以下是决定 RAM 性能的因素的简化模型(不仅在显卡上)。

    因素 A:频率

    RAM 以时钟速度运行。以 1 GHz 运行的 RAM 每秒“滴答”1,000,000,000(十亿)次。对于每个滴答声,它可以在每个通道上接收或发送一个位。因此,理论上只有一个内存通道以 1GHz 运行的 RAM 模块将提供每秒 1 吉比特的速度,因为字节有 8 位,这意味着每秒 125 兆字节。

    因素 B:“泵速”

    DDR-RAM(双倍数据速率)可以在每个滴答中传输两位,甚至还有“四泵”总线可以在每个滴答中传输 4 位,但我还没有听说后者用于显卡。

    因素 C:总线宽度。

    RAM 不仅仅只有一个通道来发送数据。甚至 Intel 4004 也有 4 位总线。你链接的显卡分别有256条公交专用道和384条公交专用道。

    将上述所有因素相乘以计算可以发送或接收数据的理论最大值:

    **每秒最大吞吐量(以字节为单位)= 频率 * 泵送率 * BusWidth / 8 **

    现在让我们计算一下您链接的两个显卡。它们似乎都使用相同类型的 RAM(GDDR5,泵速为 2),均运行在 3 GHz。

    GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s
    
    GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s
    

    因素 D:延迟 - 或现实开始

    这个因素比上述所有因素的总和更难计算。基本上,当你告诉你的内存“嘿,我想要这个数据”时,它需要一段时间才能给出答案。这种延迟取决于许多因素,并且很难计算,并且通常会导致 RAM 系统的交付量低于其理论最大值。这就是所有时间、预取和大量其他内容出现的地方。由于不仅仅是可用于营销的数字,更高的数字意味着“更好”,因此营销重点主要集中在其他方面。如果您想知道,这主要是 GDDR5 与您主板上的 DDR3 的不同之处。

    【讨论】:

    • 谢谢你,Hazzit!我明白“memorybandwidth = clock_rate*memory_width。但是memory_speed/memory_clock的概念仍然让我感到困惑......
    • Hazzit - 这是我用来计算内存余量的算法吗?真的!!!我不知道。谢谢。
    • @MissLucy 我不确定您所说的“内存余量”是什么意思。上面的公式就是“最大内存总线速度”。实际吞吐量受到该数字的限制,并且总是会略低于此最大值。
    • @RestlessC0bra 您正在查看 GPU 频率。请查看内存规格(上面有问题的链接)两者都指定为“6gbps”,意思是 3GHz * 2(因为 DDR)
    • "quad-pumped" 总线每滴答传输 4 位,但我还没有听说后者被用在显卡上 => 看看 GDDR6X 上的 PAM4 信号
    【解决方案2】:

    我认为这里解释了正确的计算:
    https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

    简而言之:
    "(内存时钟 x 总线宽度 / 8) * GDDR 类型乘数 = 带宽 (GB/s)

    GDDR 类型乘数对于 GDDR3 为 2,对于 GDDR5 为 4。"

    那里有更多的细节,很好的解释和详细的。

    【讨论】:

      【解决方案3】:

      来自https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

      (memory clock in Hz × bus width ÷ 8) × memory clock type multiplier = 带宽(MB/s)

      其中memory clock type multiplier 是以下之一:

      HBM1 / HBM2:2
      GDDR3:2
      GDDR5:4
      GDDR5X:8

      让我们以撰写本文时的顶级显卡之一,即使用 GDDR5X 内存的 GTX 1080 Ti 为例。根据techPowerUp!,这张卡的规格是:

      内存时钟:1376MHz
      总线宽度:352 位
      内存类型:GDDR5X

      如果我们将这些值代入上述公式,我们会得到:

      (1376 * 352 / 8) * 8 = 484 352 MB/s = ~484 GB/s

      对于使用旧 GDDR5 内存的GTX 1070 也是如此:

      内存时钟:2002MHz
      总线宽度:256 位
      内存类型:GDDR5

      (2002 * 256 / 8) * 4 = 256 256 MB/s = ~256 GB/s

      最后,对于使用 HBM1 的 AMD Fury X:

      内存时钟:500MHz
      总线宽度:4096 位
      内存类型:HBM1

      (500 * 4096 / 8) * 2 = 512 000 MB/s = 512 GB/s

      以及使用 HBM2 的 Vega 64

      内存时钟:945MHz
      总线宽度:2048-bit
      内存类型:HBM2

      (945 * 2048 / 8) * 2 = 483 840 MB/s = ~484 GB/s

      【讨论】:

        猜你喜欢
        • 2015-04-14
        • 2015-10-26
        • 1970-01-01
        • 2020-07-07
        • 2014-05-05
        • 2021-08-30
        • 1970-01-01
        • 2018-08-28
        • 2021-01-13
        相关资源
        最近更新 更多