2013-02-24 73 views

回答

19

巨人具有384Bit的总线而GTX 680仅具有256个,因此,50%以上存储器带宽(假定时钟和延迟是相同的

编辑:我会尽力解释整个概念的位更:下面是决定的RAM中的性能(不仅在图形卡)的因素的简化模型

系数A:频率

RAM在其时钟速度运行RAM。以1 GHz运行“滴答声“每秒十亿次(十亿次)。每次打勾时,它可以在每条车道上接收或发送一位数据。因此,只有一条运行在1GHz的内存通道的理论RAM模块将提供每秒1千兆位,因为有8位到字节,意味着每秒125兆字节。

因子B:“泵速”

DDR-RAM(双数据速率)可以每个时钟周期传送两个位,并且有连有“四抽”公交车是每个时钟周期发送4个位,但我还没有听说过后者被用在显卡上。

因子C:总线宽度。

RAM不仅仅有一条单通道发送数据。即使是英特尔4004也有4位总线。您链接的图形卡分别具有256条公交车道和384条公交车道。

所有上述因素相乘,以计算在该数据可以被发送或接收的最大理论:以每秒字节

**最大吞吐量=频率* * Pumprate BUSWIDTH/8 **

现在让我们来为你链接的两个图形卡做数学运算。他们似乎都使用相同类型的RAM(GDDR5,泵速为2),均运行在3GHz。

GTX-680: 3 Gbps * 2 * 256/8 = 192 GB/s 

GTX-Titan: 3 Gbps * 2 * 384/8 = 288 GB/s 

因子d:延迟 - 在

该因子或现实踢是困难得多,以计算大于所有上述的组合。基本上,当你告诉你的RAM“嗨,我想要这些数据”时,需要一段时间,直到找到答案。这种延迟取决于许多因素,实际上很难计算,通常会导致RAM系统的传输方式低于其理论最大值。这是所有的时间,预取和其他东西的图​​片。由于不仅数字可以用于营销,更高的数字转化为“更好”,市场营销的焦点主要集中在其他方面。而且,如果您想知道,那大多数情况下GDDR5与您在主板上使用的DDR3不同。

+0

谢谢Hazzit!我记住,“memorybandwidth = clock_rate * memory_width。但memory_speed/memory_clock的概念仍然让我困惑... – 2013-02-24 22:13:40

+0

Hazzit - 这是我用来计算内存边际的算法?真的!!!我不知道。你的 – Patricia 2015-11-09 20:36:17

+0

@MissLucy我不确定你的意思是“内存余量”,上面的公式是“最大内存总线速度”,实际的吞吐量受限于这个数字,总是会低于这个最大值 – Hazzit 2015-11-10 14:54:12

0

https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

memory clock in Hz × bus width ÷ 8)× memory clock type multiplier =带宽在MB/s的

其中memory clock type multiplier是下列之一:

HBM1/HBM2:2
GDDR3 :2
GDDR5:4
GDDR5X: 8

在写这篇文章的时候,让我们来看看目前最顶尖的显示卡之一 - 使用GDDR5X内存的GTX 1080 Ti。根据techPowerUp!,这款显卡的规格有:

内存时钟:1376MHz
总线宽度:352位
内存类型:GDDR5X

如果我们插入这些值代入上述公式,我们得到:

(1376 * 352/8)×8 = 484 352 MB /秒=〜484 GB/s的

类似地,对于其使用较旧的GDDR5存储器GTX 1070

内存时钟:2002MHz
总线宽度:256位
内存类型:GDDR5

(2002 * 256/8)* 4 = 256 256 MB /秒=〜256 GB/s的

最后,对于其使用的HBM1 AMD骚动X:

内存时钟:500MHz的
总线宽度:4096位
存储器类型:HBM1

(500 * 40 8分之96)* 2 = 512 000 MB /秒= 512 GB/s的

以及使用HBM2的Vega 64

内存时钟:945MHz
总线宽度:2048位
存储器类型:HBM2谢谢Hazzit!

(945 * 2048/8)* 2 = 483 840 MB/s =〜484 GB/s