找回密码
 中文注册
查看: 505|回复: 8

GDDR5的咆哮!AMD旗舰HD4870权威评测

[复制链接]
发表于 2008-7-24 12:08:01 | 显示全部楼层 |阅读模式
随着AMD HD4800系列的正式发布,AFan们终于扬眉吐气了一回,被压抑了许久的怨气终于在这一刻迸发,从HD4850评测文章超高的人气足以见得民心所向!HD4850是追求性价比的产物,而刚刚上市的HD4870,则代表着RV770核心的真正实力,有了全新GDDR5显存助阵,HD4870的对手已经不再是NVIDIA上代的9800GTX(+)了,而是直接将矛头对准最新的GTX260。

● 800个流处理器!R600架构终于开花结果
    从DX10时代开始,AMD就因R600核心架构问题和延期上市付出了惨重代价,导致HD2000系列高中低端全线产品处于被动局面,直到HD3000系列上市才稍微有些起色。但实际上RV670的架构相对于R600没有本质改进,只不过是通过先进的工艺降低了制造成本,提高了产品性价比,对于高端玩家来说,HD3800低下的执行效能和拙劣的AA性能显然是无法交待的。


而新一代的RV770核心则是卧薪尝胆之作,它将R600的超标量流处理器架构发挥到了极致——ATI只花费了43%额外的晶体管就将流处理器规模扩充了2.5倍!不仅如此,RV770的纹理单元、光栅单元、显存控制器都作了不小的改进,在上代显卡中所发现的问题都被及时修正。通过之前HD4850的评测就可以发现,G92核心最强者9800GTX已不是它的对手,NVIDIA引以为傲的抗锯齿效能在RV770面前简直不堪一击,很多专为N卡优化的TheWay游戏也被一一攻克……
● 避其锋芒以柔克刚!HD4800欲称霸1000-2000元价位
    无论AFan还是NFan,都应该为HD4850/4870的上市而拍手叫好,因为在HD4850面市之前,同级别的9800GTX还要卖2000块以上,HD4850发布当天就迫使NVIDIA将其瞬间降价1000块;而HD4870的出现,则让刚刚摆上柜台的GTX260自降1000元,这种举措在历史上都是极为罕见的。看来一贯保持强势风格的NVIDIA开始感觉到了压力,那么GTX260能否扛住HD4870的攻势呢?

  
HD4850 PK 9800GTX

实际上,从HD3800系列开始,AMD的产品设计思路就发生了改变,将中端显卡作为研发的重中之重,然后通过双GPU打造高端产品。上一次的HD3800仅仅是探路之作,现在的HD4800在吸取了经验教训后,将性能价格比和性能功耗比放在了第一位,努力将晶体管数控制在了10亿之内,这样无论芯片成本还是显卡制造成本都要低很多,HD4850就是严格控制成本的产物,上市价格仅为1399元,为消费者提供了千元价位最高性价比的产品!


HD4870 PK GTX260

    而NVIDIA则一如既往地通过暴力堆积晶体管的方式,打造出至高性能的旗舰显卡,然后再通过阉割的方式降低产品定位。完整规格的GTX280性能自然十分强大,但价格也是高高在上,阉割版的GTX260价格还不错,可是性能损失也不少。此消彼长之后,这就把9.56亿晶体管的HD4870与14亿晶体管的GTX260这两款看似不是同一重量级的产品放在了一起,那么作为挑战者的HD4870在性能上能否带来惊喜呢?

对于55nm工艺制造的RV770核心来说,HD4850默认625/1986MHz的频率其实是很低的,即便如此,HD4850已经击败了675/2200MHz的9800GTX,而且比起同为55nm频率高达740/2200MHz的9800GTX+都毫不逊色。看来800个流处理器的RV770核心的确拥有强大的实力,如果继续提升频率,性能还会有不小的提升空间。

  

HD4870正是代表了RV770核心的最高性能,ATI将默认频率提高到了750MHz,这与55nm的9800GTX+差不多,而显存方面则首次使用下一代的GDDR5颗粒,默认频率从3600MHz(这是等效频率,实际频率为900MHz)起跳,在显存位宽保持不变的情况下,单纯通过频率将带宽提高了近一倍,也就相当于1800MHz 512Bit的水平!

● HD4870显卡全部规格表:



仔细观察以上规格表就能发现以下几个重要问题:
同为55nm工艺,G92核心的晶体管数比RV770少,但是芯片面积反而更大!(原因参见架构解析部分)
虽然HD4870只有256Bit显存位宽,但有了GDDR5助阵,其显存带宽理论值比448Bit的GTX260还要高!
G92核心与GTX200核心的规格差距很大,但55nm的9800GTX+拥有非常高的流处理器频率,因此浮点运算能力已经能接近于GTX260了!
    由此可见,虽然RV770与GTX200核心不是同一重量级的产品,但HD4870和GTX260两款显卡的规格却是不相上下,那么最终性能表现如何呢,今天我们就通过详尽的测试来展现给大家。

首先来详细分析下RV770的核心架构,它源自于R600,但青出于蓝而胜于蓝,ATI对核心几乎所有的模块都进行了改进,而且规模和数量方面大大加强。HD4850/4870令人惊讶的性能表现就是源自于核心架构。
● RV770核心架构图:


   基本上,RV770和RV670的整体结构是相同的,RV670身上所有的模块都得到了沿用,但很多模块都经过了重新设计或者优化设计:
1。SIMD阵列扩充为10组,每组SIMD绑定专属缓存及纹理单元;
2。纹理单元数量扩充为10组,寄存器容量增加;
3。继续提升几何着色的效率,适应未来DX10游戏的需要;
4。改进可编程镶嵌单元,使之更适合于动画游戏实时渲染;
5。改进显存控制器,率先支持GDDR5,并加入显存读写缓冲区,增强数据读写命中率。
● RV770核心规格全面翻倍:



翻倍的规格是最容易理解的,但数字部分往往比较抽象,下面就详细介绍各个模块的具体含义。
    RV770核心最显著的特点就是将流处理器提升到了空前的800个,达到了RV670的2.5倍!实际上除了流处理器之外,纹理单元、光栅单元都得到了大幅增强。
● 流处理器翻2.5倍:



RV670是4组SIMD,每组16个Shader,每个Shader 5个流处理器
    RV770是10组SIMD,每组16个Shader,每个Shader 5个流处理器
    在SIMD和Shader规模扩大的同时,Ultra-Threaded Dispatch Processor(超线程分配处理器)也变得更加复杂。由于每组SIMD所包括的Shader数量增多,阵列内的Arbiter(仲裁器)和Sequencer(定序器)数量同比增加至20个,因此扩充规模后的RV770单个Shader执行效率并不会下降。
● 纹理单元翻2.5倍:




RV770的纹理单元数量相比R600/RV670翻了2.5倍,从4组增加至10组,这样RV770总共就是40个纹理单元,Shader和TMU的比例达到了4:1。
    每组纹理单元内部包含了4个纹理寻址单元(黄色,共40个),16个32位浮点纹理采样单元(橘黄色,共160个),和4个纹理过滤单元(深红色,共40个)。
● 光栅单元数量不变,规格翻倍:
    RV770还是保持4组后处理单元,也就是通常所说的16个。但这次AMD重新设计了光栅单元的内部结构,以改善R600/RV670那低下的AA效能。




R600/RV670每组后处理器单元内部包括了8个Z/模版采样,而RV770将采样数量提高至16个,多重采样(MSAA)速度直接翻倍,AMD声称RV770可以提供几乎免费的2xMSAA效能,并且4x/8xMSAA效能相比上代提升非常显著。
    RV770的AA算法最终还是交给Shader部分来处理,好在RV770的流处理器高达800个,多数情况下都处在性能过剩状态。2倍的Z/模版采样率再加上2.5倍的Shader规模,RV770的抗锯齿性能将会有一个质的飞跃,详细大家请参阅游戏测试部分。
 楼主| 发表于 2008-7-24 12:15:24 | 显示全部楼层
RV770核心不仅仅是把核心各个模块的数量翻倍这么简单,实际上在微架构方面还做了不小的优化,这方面相信很多朋友还不容易理解,下面就做一个简单的说明。

● 压缩晶体管密度,每平方毫米晶体管性能提升40%

    在GPU最关键的流处理器部分,RV770与RV670的结构是完全相同的,RV670拥有4组SIMD(每组SIMD包括16个Shader,每个Shader有5个流处理器),RV770是10组SIMD,可以说在流处理器部分只是单纯的扩充了规模。不过,这次ATI通过另外一种“投机取巧”的方式提高了RV770核心的“效能”——压缩晶体管,或者说是提高硅片的利用率。

同为55nm工艺,RV670和RV770的SIMD阵列所占体积不同

    通过上图就可以看出,从RV670到RV770,每组SIMD阵列所占用的芯片面积缩小了40%,如此一来每平方毫米晶体管所能提供的性能就提高40%。在架构和结构不变的情况下,能获得如此巨大的性能提升,看来ATI对于55nm工艺的运用已经达到了炉火纯青的地步!



RV770核心各部分模块示意图

    现在我们就可以理解,同为55nm工艺,为什么7.54亿晶体管的G92核心面积高达276平方毫米,而9.56亿晶体管的RV770核心面积只有260平方毫米!因为RV770的晶体管密度更大,G92b作为NVIDIA首颗55nm的GPU,看来晶体管密度还不够高,没有充分利用硅片面积。



RV770核心晶元切割示意图

    减少芯片面积的优势是不言而喻的,意味着一块晶元上能切割出更多的GPU核心,这样制造成本就会下降。当然与成本息息相关的还有芯片良品率的问题,RV770的晶体管密度如此之高,可能会影响良率,而且发热过于集中的问题会比较棘手。

● 纹理单元全新的缓存设计
    前面已经提到RV770相比RV670纹理单元的数量翻了2.5倍,在数量增加的同时,一二级缓存的容量和带宽都随之改进,以确保存取效率。



● 顶点着色拥有独立专署缓存
● 每一组SIMD阵列拥有单独的一级缓存(L1 TC)
● RV770核心相比RV670,L1 TC容量翻倍,总L1容量达RV670的五倍!
● 在显存控制器和显存颗粒之前拥有二级缓存
● L1纹理缓存存取速度高达480GB/s
● L1和L2缓存之前的带宽高达384GB/s

● 抗锯齿效能翻倍:
    在之前HD4850的评测中我们已经发现,其AA效能大幅超越HD3870,和9800GTX/+相比也能够反败为胜,而且AA等级越高优势就越明显!



可以看出,全新的ROP单元大大加强了RV770核心的多重采样效能,如果不开AA那么RV770就没什么优势,一旦打开2x/4x/8xAA,那么它惊人的实力就会被完全释放出来。
     由于目前玩家们对游戏画质的要求很高,抗锯齿基本上成为了每个游戏的默认特效,再加上目前高端显卡的实力够强,在打开AA的情况下都有不错的FPS,因此4xAA应该是基本配置,更何况微软已经将4xMSAA列为DX10.1的默认标准,所以高端显卡的性能应该以打开4xMSAA为准!


     随着GPU核心处理能力日益强大,对显存带宽的渴求也与日俱增,这个道理与CPU对内存的需求相似。芯片厂商扩充带宽的手段主要有三种,一是增加显存控制器的位宽(即多通道),二是提高显存的频率,三是采用新一代规格的显存。
● 显存位宽不能随意扩充:
    目前的主流GPU都是256Bit的,只有部分顶级核心采用了更高的位宽,例如G80是384Bit,R600和GTX200是512Bit。显存位宽加倍,带宽自然加倍,但是付出的代价也不菲:

显存控制器在GTX200核心中所占据的芯片面积仅次于流处理器

    GPU集成512Bit显存控制器需要消耗大量的晶体管,而且对显卡PCB布线提出了严格要求,另外显存颗粒的数量也需要翻倍,成本增加严重不成比例!因此,除非是为了追求极致性能的顶级显卡,其它情况下都会避免扩充位宽,甚至是降低位宽(比如128Bit才是真正主流)。
● 显存频率提升举步维艰:
    提高显存频率很容易理解,但由于规格和工艺所限,显存频率的增长十分缓慢,目前主流的GDDR3颗粒好不容易从1.0ns进化到0.8ns,频率达到2200MHz左右以后就很难继续前进了。

   

三星和现代的0.8ns GDDR3显存已经在高端显卡上得到了普及

    比如NVIDIA最新55nm的9800GTX+,核心和流处理器频率大幅提升,但显存频率却在2200MHz原地踏步,GTX280的默认显存频率也是2214MHz,原因就是GDDR3显存已经遇到了瓶颈。0.8ns颗粒理论频率能达到2500MHz,但是8颗(256Bit)甚至16颗(512Bit)显存同时达到2500MHz就有些难度了,稳定性难以保证!
● GDDR3气数已尽、GDDR4不过如此、GDDR5初露锋芒:
    在GDDR3显存频率难以继续提升的情况下,ATI和JEDEG(国际内存标准的制定组织)制定了GDDR4颗粒标准,并在X1950XTX、HD2900XT、HD2600XT、HD3870等显卡上率先使用GDDR4。但由于NVIDIA的反对,加之ATI显卡不够强势,内存芯片厂商对于GDDR4没有表现出很高的兴趣。而且最主要的是GDDR4未能解决功耗和成本问题,而且带宽提升并显著。


GDDR4的确更好超,但性能提升有限

    举例来说:同为0.8ns的GDDR3和GDDR4,虽然GDDR4容易达到更高频率,但是由于延迟的增加,实际性能甚至比GDDR3还要差,因此GDDR4被冷落也在情理之中。最终由于内存芯片厂商没有投入精力研发改良GDDR4,其规格也就止步于0.8/0.7ns,相比GDDR3没有质的提升,业界普遍认为应该跳过GDDR4直接过渡到GDDR5。
    此次,又是ATI捷足先登,HD4870率先采用GDDR5显存颗粒,在保持256Bit显存位宽不变的情况下,大幅提升了显存频率,消除了困扰多年的带宽瓶颈。

   与追求低成本的HD4850不同,HD4870则是一款真正意义上的高端显卡,ATI昔日高端显卡上那些豪华的散热器、供电模快、完美的做工再次呈现在大家面前:

   
显卡正面:造型有点像HD2900XT

显卡背面:密密麻麻的元件再现ATI原厂卡风范

双槽散热器十分威猛

双DVI输出,双槽散热器

    双槽散热器出了性能更好之外,还有个优势就是能把显卡发出的热量全部排出到机箱之外,这样就不会给机箱散热造成负担。输出接口采用了中高端显卡常用的双Dual-DVI+S-VIDEo,配合ATI原装的专用DVI转HDMI输出转接头即可方便的实现HDMI输出,加上本身集成的UVD单元,高清视频不用愁。
回复

使用道具 举报

 楼主| 发表于 2008-7-24 12:23:53 | 显示全部楼层
HD4850默认核心电压和频率都很低,因此单槽散热器就能搞定,而HD4870的默认频率高达750MHz,再加上超高频率的GDDR5显存,发热量增加了不少,因此公版卡配备了双槽热管散热器,现在我们就把它拆开来一窥究竟:





纯铜底座加上大散热面积铝制散热片

HD4870散热器的整体结构和HD2900XT类似,不过散热片并非纯铜,只有底座是纯铜打造,看来RV770核心虽然晶体管增加不少,但发热量和R600相比还是要低一些。







在散热原理上,纯铜底座通过两根粗壮的热管将热量传导至大面积铝制散热片上,在通过涡轮风扇将热量吹向机箱外。

取下散热器之后,就来看看HD4870裸卡,可以看到显卡各个模块的布局整齐划一,是一如既往的ATI原厂设计风格,熟悉的数字供电模快又出现了:





55nm工艺、9.56亿晶体管的RV770核心面积并不小

裸奔的HD4870


齐梦达GDDR5显存颗粒,-40X代表等效理论频率为4000MHz

    作为世界上首款采用GDDR5显存的显卡,HD4870给我们太多的期待。可以看到显存采用奇梦达的IDGV51-05A1F1C-40X GDDR5颗粒,采用PG-TFBGA 170封装格式,一共组成512MB 256Bit的容量,理论运行频率可达4000MHz,实际默认频率为3600MHz,看来还有不小的超频潜力供玩家挖掘。

   与HD4850显卡上传统的2+1相供电不同,此次HD4870又采用了极为豪华的数字供电。与GTX280显卡上零乱的布局不同,ATI对于数字供电的使用显然更为得心应手,三胞胎电感、陶瓷电容排列得井井有条,下面就对其供电模块进行详细分析:

供电模块一目了然:核心三相+显存两相



核心供电主控芯片VT1165MF(NVIDIA GTX280也用的是这颗芯片)


核心供电为三相,使用了一个连体三胞胎电感,MOS为三颗VT1195

    单颗VT1195能够提供40A电流,三相就是120A,这要比GTX260的三颗VT1165提供的90A还要大!实际上HD4870的峰值电流还不到100A,这样的冗余设计显然是留给玩家超频之用。另外大家可以看到HD4870的PCB其实有一相被空焊,也就是说最大可支持四相供电,最高可提供160A的电流,看来ATI认为四相太奢侈了,所以被缩水掉了。



显存供电为两颗VT235WF,并没有电源主控芯片,因为这颗VT235WF的集成度更高,它将主控芯片、驱动IC电路和MOS管全部整合在了一起,因此看上去VT235WF比VT1195SF的芯片面积要更大一些。两相式供电为显存提供了最大60A电流,可满足超高频率下稳定运行。
    看得出来,为了让RV770核心运行在更高频率,也为了对GDDR5显存提供充足动力,HD4870的数字供电模块设计比GTX260还要豪华,如果将空焊不全的话,NV史上最豪华的GFX280也只能是甘拜下风(单纯比供电模块的配置)。
    豪华的供电再加上产量有限的GDDR5显存,HD4870的成本并不低,以目前的售价来看的确是相当厚道了。

其他品牌,诸如华硕等一线二线的评测,见这里 , 忆年华转贴整理.
回复

使用道具 举报

发表于 2008-7-24 12:44:49 | 显示全部楼层
恩!!!   那个有点看不懂```   太深奥了
回复

使用道具 举报

发表于 2008-7-25 20:47:11 | 显示全部楼层
强!关注!下次装机就是它啦!
回复

使用道具 举报

发表于 2008-7-26 00:47:29 | 显示全部楼层
不知道多少大洋~~~
回复

使用道具 举报

 楼主| 发表于 2008-7-26 00:58:07 | 显示全部楼层
原帖由 admin 于 2008-7-26 00:47 发表
不知道多少大洋~~~



貌似工薪阶层消费水平有限.
爱发烧的小资们可以玩玩~~~
我们还是先等等看.等降价了..再买..
虽然不能冲在最前端,但是依旧跟上时代的步伐即可.
回复

使用道具 举报

发表于 2008-7-27 13:14:11 | 显示全部楼层
显卡首推XFX   没有第2
回复

使用道具 举报

 楼主| 发表于 2008-7-27 23:21:24 | 显示全部楼层
原帖由 过客 于 2008-7-27 13:14 发表
显卡首推XFX   没有第2



N卡如此,同意此观点~~   
A卡呢?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 中文注册

本版积分规则

Archiver|小黑屋|加入我们|偃师网 ( 豫ICP备11013690号 )

GMT+8, 2025-4-30 13:02 , Processed in 0.035636 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表