【问题标题】:GPU-Performance in CUDA with textures带有纹理的 CUDA 中的 GPU 性能
【发布时间】:2012-11-29 23:30:30
【问题描述】:

我有一个关于 NVIDIA GPU 性能的问题。我有一个实现,我在两个数组之间进行插值。使用倾斜到线性内存的纹理比使用 CUDA-Arrays 更快。目前我只在一个 GPU 上尝试过。 每个 GPU 上都是这种情况还是会有差异? 我在笔记本电脑中使用 GPU。 桌面 GPU 速度快得多吗?因为目前我只获得了 2-3 的加速。

我可能看起来像一个愚蠢的问题,但如果有人在许多 GPU 上处理纹理,我会很感激。我很奇怪使用 CUDA-Arrays(应该有一些缓存优化......)会更慢。

我正在开发 NVIDIA Quadro 2000m,并将其与 I7-2860QM @ 2,50GHZ(实施)进行比较。这是一场公平的比赛吗?

【问题讨论】:

  • 在这里,反之亦然,cuda-arrays 比 pitched memory 快:devtalk.nvidia.com/default/topic/504608/…
  • 只是为了确保 - 您是在谈论全局内存访问与纹理还是线性内存中的纹理与 CUDA 阵列中的纹理?如果是后者,我下面的回答不适用。
  • 我正在讨论线性内存中的纹理与 cuda 阵列中的纹理

标签: .net cuda


【解决方案1】:

具有计算能力 2.0 或更高缓存全局内存以及纹理的 GPU,因此纹理在 CC 1.x 时代的主要优势已不复存在。

恰恰相反,关于纹理的一点点提到的事实是,由于需要在硬连线布局的寄存器中存储多个参数和返回值,它们会增加寄存器压力。此外,全局内存的缓存大于纹理内存的缓存。所以通过纹理读取内存会比直接访问全局内存慢也就不足为奇了。

这一特性对于移动或桌面 GPU 来说应该是相同的,尽管高端桌面 GPU 的速度可能比移动设备快 2 到 5 倍。

【讨论】:

    猜你喜欢
    • 2013-01-11
    • 2014-01-30
    • 1970-01-01
    • 2018-06-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-26
    • 2011-05-17
    相关资源
    最近更新 更多