【发布时间】:2011-10-11 20:27:34
【问题描述】:
我正在读这个Dr Dobb's Article on CUDA
在我的系统中,全局内存带宽略高于 60 GB/s。 这非常好,直到您认为此带宽必须服务 128 个硬件线程——每个线程都可以交付大量 浮点运算。由于 32 位浮点值 占用四 (4) 个字节,全局内存带宽有限的应用程序 在这个硬件上将只能提供大约 15 GF/s——或者 仅占可用性能能力的一小部分。
问题:GF/s 是指每秒 Giga flops 吗??
【问题讨论】:
-
FLOPS 中的 PS 代表“每秒”,
FLOPS per second因此类似于spped per second或hertz per second。如果你的意思是每秒浮点运算,那已经是 FLOPS。 -
GF/s 将是浮点运算的加速。
-
和 GF/s 可能是 GigaFlop/s 或 GigaFLOPS 的缩写。而且这个缩写比抽象的“GF”要好一点
标签: cuda terminology hpc parallel-processing