ATI Radeon HD 4850的详细介绍

如果说DirectX 9.0C是像素渲染的时代,那么到了DirectX 10时代,渲染单元无疑成为了最影响显卡性能的架构单位之一。在末DX9时代,ATi意识到像素渲染的重要性,从R520(X1800XT)到R580(X1950XT)就通过1:3的黄金架构,暴力的提高了像素单元的数量,而得到的效果是立竿见影的。

ATi对这种“人口战术”似乎非常偏爱,一直到了DX10时代,还是通过这种多比例的方式来提高重要的渲染单元,现在在ATi的架构中,流处理器和流处理单元的比例就是1:5。

RV770的整体核心规格是在RV670的基础上进行了相关的扩充以及优化,它的具体改进有以下几点:

1、更多的流处理单元:RV770在流处理器组群上由原来RV670的4组扩充至10组,因此流处理器也有了2.5倍的增长,达到160个(160x5=800个流处理单元)。

2、优化过的纹理处理单元:和流处理器组一样,RV770的纹理单元也由RV670的4组扩充至10组,因此纹理填充单元也由当初的16个增加至40个,增长幅度为2.5倍。

3、更新的记忆体架构:RV770首发支持了最新的GDDR5技术,比起RV670,RV770还加入了显存读/写缓存区,但在显存位宽上,RV770还是保持了原来的256bit。

4、重新优化过架构的Render Back Ends:在架构上做了相关的优化,优化了RV770在AA特效下的性能表现。 发展到今天,GPU在电脑中占有的位置无疑越来越重要,主要表示在2D/3D视频显示处理上。在GPU能够实现硬件解码之前,所有高清片源都要通过CPU来进行解码,这样其实大大占用了CPU的使用率,而视频部分本来就应该由GPU来负责,因此在新一代的GPU中,无论nVIDIA又或是ATi都引入了高清硬件解码的技术。而在这一方面,ATi无疑做得比nVIDIA更好,第一代UVD就能够实现了H.264及VC-1的高清硬解技术,而如今随着RV770的发布,ATi已经更新至第二代的UVD解码器。

第二代UVD最大的改进就是支持了多流解码,这个概念即是表示UVD2能够支持多部高清片源同时解码,比起nVIDIA的双流解码功能更为强大。而在高清片源的支持上,UVD2已经能够支持2160P的视频解码了! 更低的制作工艺意味着在更小的核心体积下能够集成更多的晶体管,ATi自RV670起就采用了55nm的先进技术,领先于竞争对手,目前RV770已经是第二代的55nm工艺显示核心了。新的RV770核心面积260m㎡,而晶体管数量已经达到9.56亿,接近10亿的数量。

尽管在生产工艺上领先于对手,ATi还是没有放弃节能技术上的开发,上代RV670就推出了第一代桌面级显卡的PowerPlay节能技术——一个类似于笔记本的节能技术,当GPU空闲时显卡就会自动降频以达到节能的目的。而现在RV770又再推出了第二代的PowerPlay节能技术,而ATI也给它起了另外一个名字“Power on Demand”,最大的特色是显卡会根据GPU、显存的占用率来自动调配资源。 我们常说的物理加速引擎主要分为PhysX和Havok两种,其中开发的PhysX的Ageia已经被nVIDIA收购,而nVIDIA在G92和最新的GT200系列显卡上都加入了PhysX的物理加速功能,在以后nVIDIA将会针对支持物理加速的显卡推出新的驱动,用户仅需通过更新驱动就能免费获得显卡性能提升。

目前nVIDIA和Intel针对GPU和CPU展开了激烈的话题讨论,双方各执一词,nVIDIA希望往后的发展会靠向GPU这一边,而Intel始终坚持PC里GPU只作辅助CPU之用,而在这场口水战中,AMD占据的位置无疑更为重要,因为目前就全球来说,仅有AMD一家拥有CPU和GPU整个组合平台,AMD认为只有合理的分配好CPU和GPU,平台才能发挥出最佳的性能表现。目前nVIDIA和Intel已经分别将两家拥有物理技术的公司Ageia和Havok收购,作为对抗nVIDIA的PhysX物理引擎,ATi这次借助了Intel的Havok API来展开对物理加速引擎的支持。

其实在很早之前,大量PS2、Xbox平台游戏都已经开始采用Havok引擎,这款物理引擎现在被广泛用于3D MAX设计和游戏开发中,是目前世界上最快、最方便的跨平台游戏图形解决方案,也是现今应用最为广泛的物理引擎之一。据AMD表示,在未来的日子里,将会有大量游戏开发商以他们及Havok的物理技术去创造新的3D游戏,相信相关的开发成品已经迫在眼前。 nVIDIA提出了CUDA(Compute Unified Device Architecture)这个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。无可否认,随着GPU技术的不断发展,GPU目前在整套PC中占有的位置已经越来越重要,而nVIDIA于早段时间推出的GeForce GTX 280除了拥有超强的图形运算能力,同时也是一款非常出色处理器并行架构处理器,浮点运算能力也达到了933GFlops,是目前CPU处理器的10倍左右。

而ATi最新发布的RV770,就Radeon HD 4850来看,其浮点运算能力已经达到1TFOLPS,比起nVIDIA的新旗舰显卡GTX280还要高出不少,从理论来看,ATI RV770在并行处理能力上还是占有不少优势的,当然还得看实际的运行效率。

ATi垂青的是由苹果公布的OpenCL开放式标准,它其中包括了物理运算、科学、图形工作和娱乐等多方面的协调,旨在高度利用GPU的资源,来承担更多的工作。 从功能上理解,我们可以将显存看作是GPU内核与像素渲染管线之间的桥梁或与仓库。显然,显存的容量决定“仓库”的大小,而显存的带宽决定“桥梁”的宽窄,两者缺一不可,这也就是我们常常说道的“显存容量”与“显存速度”。更快速的显存技术对整体3D性能表现有重大的贡献,数据在渲染管线间传送所花的时间通常比GPU执行功能所花的时间更长,因此提高显存带宽往往能够比提高GPU核心频率取得更为明显的效果。

从上面的概念理解,我们可以知道显存带宽对于决定显卡的性能起到相当大的作用,由显存带宽=(显存位宽 x 显存工作频率)/ 8 的公式可知,决定显存带宽的主要有显存位宽和显存频率,ATi的R600,因为配备了512bit的显存位宽,因此它显存带宽达到史无前例的106GB/sec,而到了RV670,ATi通过精简架构,将显存位宽重新定位在256bit上,虽然通过搭配频率更高的GDDR4显存,在一定程度上能够提高显存带宽,带始终GDDR4存在较大延时,也导致了GDDR4对比GDDR3时没有太大的优势。如今ATi的Radeon HD 4870将采用GDDR5显存,显存频率能够达到3600Mhz甚至更高,这也补充了RV770 256bit显存位宽的不足。

从AMD的官方资料来看,显存带宽得益于GDDR的更新换代,在近几年有了不少的飞跃,其中DDR2——GDDR3显存带宽经历了一次成倍的增长,而另一次显存带宽的大爆发,将在GDDR4——GDDR5的这段过程上发生。

ATi在显存技术上向来走在业界的最前端,在竞争对手还是使用GDDR3显存时,ATi的RV770已经投入到GDDR5技术了。目前投产于GDDR5显存技术的已经有奇梦达、三星、海力士三家,而其中奇梦达更是抢先和AMD达成了合作,据了解首批出货的Radeon HD 4870都是采用奇梦达的GDDR5显存,额定运行频率为3600Mhz。

我们可以看见ATI的Radeon HD4870将采用奇梦达GDDR5的显存颗粒,编号为“IDGV51-05A1F1C-40X”,理论运行频率能够达到4000Mhz。