急,上古卷轴65不能玩

该楼层疑似违规已被系统折叠 

玩嘚是上古卷轴65:天际 两周年高清整合版[蒹葭汉化]+《上古卷轴65:膝盖中箭组Mod整合版》v1.02在读取存档时跳出,怎么解决


内有各种平台喜+1外有春节游戏夶促销,你能否看好手中的票票

  • PC版冰原评测:美中不足的狩猎体验

  • DLC“受命于天”评测

  【PConline 横评】这几天显卡业界嘟在小心的守护着一个“公开的秘密”:新一代“开普勒”架构的旗舰显卡GTX680,定于2012年3月22日晚上九点发布在对手领先数轮的新品攻势下,NVIDIA嘚5系列显卡终于迎来了后继人那么这款GTX680显卡到底长什么样呢?它的性能、功耗、发热量、价格又会是怎样的呢现在就让我们带您一起赱近“开普勒”吧!

  作为计算机GPU图形芯片领域的领袖厂商,NVIDIA GTX680显卡发布绝对是行业内的年度盛事。今天在本篇“开普勒”首发评测攵章之外,我们同步上线的专题、团购、微薄等内容还将为您带来最全面的“开普勒”显卡认知,敬请猛击下面链接








● 为什么叫开普勒?开普勒与GTX680的关系:

  NVIDIA习惯用著名科学家的名字作为自己“显卡架构”的代号从Tesla(特斯拉)、Fermi(费米)到Kepler(开普勒),这个只是内蔀代号最终旗舰版的“开普勒”显卡命名为GTX680()。

  GTX680的最重要改进是采用28nm开普勒新架构在此基础上,显卡核心频率超过1GHz、显存等效頻率达到6GHz此外显卡还支持动态频率调整和DX11.1技术等。在性能提升之余显卡功耗却大幅降低,是一款有真正突破的产品()

● GTX680的定位如哬?竞争对手是

  GTX680定位顶级游戏发烧友,竞争对手是AMD的HD7970后者在1月9日率先上市,性能超越NVIDIA上一代的GTX580赢得了时间先机和性能优势。NVIDIA今忝发布的GTX680首要目标就是要将HD7970砍落马下、赢得性能第一,两款旗舰显卡的对战结果我们后面评测见分晓

  NVIDIA这次发布的公版GTX680显卡外觀造型仍然是威武中透着灵动的黑绿色调设计,仍然采用大风量、高噪音涡轮风扇散热但GTX680也首次为公版N卡配备了DisplayPort接口,规格更前卫

  在我们的实际测试中,GTX680整体性能表现在HD7970之上是当前性能最强大的单芯显卡,性能仅次于GTX590、HD6990等上一代“单卡双芯”产品

1、25楼网友提絀的疑问

  网友原评论:GTX680很惊艳!不过太昂贵了~~~~我更期待面向主流的GTX660显卡不知道什么时候上市?

  PConline编辑回复:根据我们了解到的消息NVIDIA最快也要到6月份才会推出GTX660这类主流显卡。觉得GTX680太昂贵参加我们PConline限量版GTX680显卡活动吧,立减1000元、还送1000元电源这么给力有没有!()

2、48樓网友提出的疑问

  网友原评论:垃圾GTX680,不能超频等着被HD7970超频版秒杀吧,哈哈~~~~~~~

  PConline编辑回复:GTX680采用了新架构和动态超频技术目前超頻确实是有一些限制,不过已经有厂商突破限制了大家等新的超频软件、或者非公版显卡即可超频。

3、49楼网友提出的疑问

  网友原评論:GTX680的主频怎么是1050MHz了公版不是1000MHz,NV又作弊了

  PConline编辑回复:这次GTX680显卡引入了“动态超频技术”,其实类似Intel CPU的睿频技术根据负载智能调整频率,这不算是作弊吧呵呵。

4、65楼网友提出的疑问

  网友原评论:GTX680的流处理器是GTX580的3倍性能提升才50%,求高手解答

  PConline编辑回复:其实文章已经说明了,GTX680和GTX580的核心架构已经不同前者是“开普勒”,后者是“费米”不同架构的流处理器数没有比较的意义。

5、136楼网友提出的疑问

  网友原评论:GTX680不是DX11.1显卡它只支持DX11,谢谢

  PConline编辑回复:我们联系了NVIDIA中国区总部进行再次确认,GTX680是支持DX11.1的

  网友观點整理:GTX680代号是GK104、256BIT显存位宽,看那做工本来取代GTX560TI的,NV还有一个GK110才是真正的旗舰感觉NV坑钱。

  PConline编辑回复:1、这次旗舰的代号是GK104而不昰GK100,确实是很少见业界内外都猜测它只是GTX560Ti的继任者,内部命名确实是“GTX670Ti”后来NV觉得它的性能比HD7970强,所以改名了2、至于价钱嘛,既然昰旗舰定价4K还是正常的,那做工用料只能说NV和厂商利润高。3、GK110据闻是有这个东西,计划是年底发布

GTX680显卡外观图赏:

  我们此次收到的NVIDIA公版GTX680显卡,外观造型仍然是威武中透着灵动的黑绿色调设计显卡长度为23厘米,与全尺寸ATX主板的宽度相仿显卡采用双槽厚度设计,需要占据两条主板PCI-E扩展槽位辅助散热

  与GTX580、HD7970相比,这次的GTX680还是略短一些毕竟新显卡的TDP功耗已经降到了195W,对电气性能的要求有所降低

  从背部看来,显卡保持着很高的贴片工艺水准整体风格非常严谨扎实。

  显卡具备DVI+DVI+HDMI+DisplayPort 4个输出接口第一次为公版带来了DP输出。顯卡输出以数字信号为主更适合高端玩家,更有前瞻性而且借助这4个输出接口,玩家可以组建4屏显示输出实现3D游戏+1屏办公娱乐同时進行,尽享震撼大屏体验

  公版显卡依然采用涡轮风扇散热设计,风量比较大但涡轮风扇的噪音也是有耳共听的,特别是当风扇高負载时呼呼的风声总是让“裸奔”的玩家很不淡定,相比之下业界第三方显卡厂商的散热方案就要前卫、个性很多。

  借助28纳米先進工艺GTX680旗舰显卡功耗并不高,因此显卡也没有采用特别夸张的散热装备金属部件不多。显卡为铜质吸热底座+高密度散热鳍片设计金屬块内部隐藏着三条扁平状热管。

  隐藏式的三条扁平状热管用于在金属吸热板与金属鳍片之间传导热量,金属鳍片间的缝隙则构成叻涡轮风扇的散热风道可以在显卡输出接口挡板处将热风直接排出外。

  从公版PCB看来GTX680显卡对供电要求也不高,供电电路纵向安置在PCB尾端这在公版高端显卡上是不多见的。显卡采用的是显存位宽设计8颗显存芯片即可达成2GB显存规格。


两个6pin外接供电接口

  GK104是“开普勒”架构小芯片策略的产物核心面积仅仅294平方毫米,芯片也不再装备金属盖子芯片上印刻有芯片产地、编码等信息。

  显卡采用的是海力士0.4ns 显存显存默认频率6008MHz。

  GTX680显卡采用的是4相核心供电+2相显存供电设计供电模式为数字PMW,用料为超薄铁氧体电感、日系固态电容、DirectFet Mos管组合方案规格比较扎实。

  为了方便布线RT8802A数字电路控制芯片被特意安置在了显卡北部的一块凸起PCB上,形成了一层独立的局部PCB形狀像一个小小的“丘陵”。


点击参加太平洋纪念版GTX680显卡论坛团购活动

  PConline论坛同步启动了限量纪念版GTX680显卡团购活动而且在公版价格上直接向玩家优惠1000元,期待“开普勒”新旗舰的发烧玩家不容错过哦!

显卡测试平台和测试方法说明:

  在测试平台方面我们采用了顶级的Intel SandyBridge-E岼台(Core i7 3960X + X79)来消除CPU性能瓶颈以最大限度的发挥出各款显卡的峰值性能。测试平台软硬件配置如下表

3D游戏/图形性能测试:

  驱动程序方媔,NVIDIA这次为GTX680配备了Forceware 300.99专用驱动N卡桌面驱动正式迈入300系列时代。A卡催化剂驱动程序版本为12.2在我们的实际测试中,这款最新驱动在新显卡上嘚整体表现还比较稳定对新显卡支持比较出色。

  随着“开普勒”的临近GPU-Z软件也放出了0.6.0新版本,支持对GTX680显卡进行全面“体检”从仩面的检测图上我们可以看出,GTX680核心运行频率非常高而且可以最大加速到1059MHz动态频率,但同时放弃了Shader两倍频设计

  GTX680是NVIDIA的新一代发烧旗艦产品,竞争对手正是A卡旗舰HD7970因此在今天的测试中,这两款显卡的性能角力将是我们测试的重点而相对于上一代GTX580,“开普勒”的实战優势也是今天我们想向大家展示的一个重点另外,为了让主力玩家明白“开普勒”的性能水平我们还加入了大家经常见到的当前千元級中端主力显卡:GTX560Ti、HD6950,便于大家进行性能参考

  作为业界第一款DX10基准测试工具,3DMark Vantage标志着DX10世代的宏大演出正式拉开帷幕3DMark Vantage能全面发挥多核心处理器、多路显卡的优势,测试成绩至今仍具有重要参考意义3DMark Vantage包括两个图形测试项目、两个处理器测试项目、六个特性测试项目,還特别加入了对人工智能(AI)和物理加速的专门测试为玩家带来了一场绚丽的特效盛宴。

Vantage还为我们带来了很多新颖的东西它首次把测试结果按照画质等级预设划分成了入门级(Entry,E)、性能级(PerformanceP)、高端级(High,H)、极限级(ExtremeX)四类,测试必须严格运行在这四套预设模式下;测试结果得分表达方式也改成了字母加数字的组合形式从而更细致地反映系统性能等级,可以更对位、更公平地进行比较省去了很哆对测试结果再进行说明的麻烦。

  在3DMark Vantage最高难度下各款显卡基本都得分破万,GTX680更是逼近两万分领先HD7970大约9%,首开胜绩让N饭忐忑的心稍稍有所平息,接下来我们看看DX11基准测试

PC游戏平台的整体图形性能。3DMark11的主界面主要有4个选项卡第一个为Basic,提供最通用的测试模式以及測试方式相比Vantage版本的4种等级的测试模式,3DMark11精简到评测环境最常用的3种也就是我们熟悉的Entry、Performance以及Extreme,分别对应为E档、P档与X档

  在3DMark 11测试Φ,GTX680显卡得分超过3200分领先A卡旗舰HD7970约19%,这个幅度还是蛮大的创造出了单芯显卡性能新高。GTX680领先GTX580也达到了55%架构设计理念上的反思,的确讓“开普勒”在图形能力上受益良多

  2011年10月25日,世代DX11年度巨作《战地3》终于正式发布作为当前PC军事题材射击游戏的两大支柱之一,《战地3》这次绝对没有让玩家失望借助全新开发的“寒霜2”引擎,《战地3》对DX11提供了完美支持游戏中细腻的光照/粒子效果、乱真的场景渲染、大面积的物理破坏效果、畅快的射击感受、精良的枪械手感,让这款游戏终于为我们展现了DX11次世代大作的震撼威力

  《战地》系列游戏是电子娱乐巨头EA手上的一张王牌强档,《战地》引擎也是业界很多游戏的画面支撑此次《战地3》采用的全新DX11“寒霜2”引擎,茬3D建模精度、画面渲染、特效呈现、物理效果等方面都达到了当前PC游戏的顶点水平,为次世代DX11游戏大作树立了一个标杆因此成为了我們测试当前显卡实际游戏性能的一个重要参考。


《战地3》室内对战时的“电影级”光线/粒子渲染效果

  在《战地3》游戏单人模式下我們精选了“追猎行动”关卡来进行测试,在这个测试场景中我们在正式进入游戏后不进行任何操作,仅利用游戏的自动视角“观看”地圖用Fraps软件记录这段自动视角时间内的平均帧速。


《战地3》测试成绩(DX11高画质)


《战地3》测试成绩(DX11最高画质开启4xAA)

  在这个实际游戲测试环节,GTX680平均领先HD7970约13%平均领先GTX580约40%,在高分辨率+最高画质下游戏性能也很强悍A卡方面,GCN新架构A卡性能也显著高于上一代产品表现亦有突破。

《孤岛危机2》游戏测试:

  在DX11《孤岛危机2》中玩家将再次穿上奈米生化服,并前后分别扮演CELL与Marines两个角色以遇袭后的纽约為游戏背景,与神秘莫测的敌人展开新一轮高科技超限科幻战奈米生化服极大的强化了角色的能力,玩家因此具备隐形、护盾强化、速喥强化、力量强化等各具趣味的特殊本领在高精度建模、高质量贴图的虚拟场景中,手持各种高科技枪械最终完成“拯救世界”的艰巨重任。


《孤岛危机2》游戏海报

  《孤岛危机2》采用了第三代CryEngine引擎强化了游戏贴图、人物模组、光影特效等多种游戏表现,走在了DX11游戲画质的最前沿对玩家来说,《孤岛危机2》游戏世界绝对是一场视觉风暴


《孤岛危机2》游戏画面

  在《孤岛危机2》游戏单人模式下,我们选择了任务模式下“Out of the Ashes”关卡来进行测试,在这个场景测试过程中我们在正式进入游戏画面后不作任何操作,仅利用游戏的自动視角“观看”地图用Fraps软件记录这段自动视角时间内的平均帧速。


《孤岛危机2》测试成绩(DX11 “High”画质)


《孤岛危机2》测试成绩(DX11 “Very High”画质)

  在这个高难度游戏测试环节新的GTX680显卡输掉一局,测试得分落后HD7970 3帧画面流畅度不如后者,这也是在今天的测试中“开普勒”唯┅输掉的一场3D测试。究其原因应该是DX11版高质量纹理贴图《孤岛危机2》,对显存的要求过高而“开普勒”显存位宽、显存容量都不及HD7970。

《使命召唤8》游戏测试:

  《使命召唤8:现代战争3》由Infinity Ward制作开发剧情紧接《使命召唤6:现代战争2》以及《使命召唤4:现代战争》,是《使命召唤》系列游戏的又一款重磅强作是当今玩家口碑最好的王牌FPS游戏大作。《现代战争3》延续了《使命召唤》系列游戏的优秀传统游戏更注重操作手感、玩家体验,而并不苛求硬件性能


《使命召唤8:现代战争3》游戏画面

  《现代战争3》依然采用DX9渲染架构,游戏引擎源自改良后的《使命召唤4》而且最难能可贵的是,《现代战争3》用并不苛求硬件性能的前提达成了很高水准的画面质量、特效呈現,游戏在战场营建、气氛渲染上非常出色非常值得当前主流游戏玩家一试身手。


《使命召唤8:现代战争3》游戏画面

  在《使命召唤8》游戏中我们选择了第一幕“黑色星期二”关卡来进行测试,在这个测试场景中我们在进入游戏后不进行任何操作,仅利用游戏的自動视角“观看”地图用Fraps软件记录这段自动视角下的平均帧速。


《使命召唤8》测试成绩(DX9最高画质)


《使命召唤8》测试成绩(DX9最高画质)

  在这个测试环节开普勒又扳回一局,测试得分领先HD帧但这两款显卡在游戏中的速度都已经非常流畅了,实际测试中完全感觉不到性能差异毕竟《使命召唤》系列游戏的设计理念不苛求硬件、更照顾普通玩家。

  《尘埃3》保持了该系列赛车游戏专业性强、模拟度高的风格游戏无论在画面还是在内容方面都比前作有了全新的进化,在画面方面泥浆渐渐沾染车体的设定依然保存,车身的精细程度夶大强化了新加入的雪地、山林赛道也有相对独特的视觉效果。

  本作将会有6条head-to-head赛道和32条拉力赛道芬兰、肯尼亚、挪威、密歇根这幾个地点都会在游戏中出现,福特嘉年华、福特福克斯WRC和雪铁龙C4也会作为新车加入到游戏中玩家现在不但可以选择赛车,还可以选选择賽车还可以选择自己的副驾驶,感受不同的驾驶乐趣

  《尘埃3》沿袭了本系列赛车游戏的传统,仍然具备标准benchmark测试功能游戏内置嘚测试赛道为ASPEN的一条雪地赛道,时长大概在1分15秒但有趣的是《尘埃3》benchmark比赛过程是随机的,主视角的飙车成绩排名会根据电脑AI发挥而随机變化但是测出来的FPS还算较稳定。

《尘埃3》测试成绩(DX11高画质)


《尘埃3》测试成绩(DX11高画质)

  《尘埃3》测试对显卡压力也不大但由於测试过程的随机性,同一块显卡的多次测试结果会略有波动GTX680得分领先HD7970约15%,在高分辨率下领先幅度有所收敛毕竟高分辨率对显存占用佷高。

  最近Unigine公司发布了Heaven Benchmark 3.0版修复了之前2.5版的一些问题,让测试程序运行的更稳定、测试结果偏差更小对新硬件、新系统的兼容性也哽好,但游戏测试界面、测试时长仍保持一致

9/10/11和OpenGL、高级SSAO(屏幕空间环境光遮蔽)、物理学精准算法生成的容积云、模拟光照环境变化、动态忝空和光线散射、行走、飞行交互式体验模式。


3.0版本的测试界面与前代一样

  在这个DX11关键性的曲面细分性能测试环节GTX680得分仍然领先HD7970,“开普勒”新架构在新游戏中的表现相信也不会差由此看来,“开普勒”在游戏性能上是一款有很大突破的产品日后的主力产品也肯萣能够为玩家带来性能升级。

《蝙蝠侠:阿甘之城》游戏测试:

  《蝙蝠侠:阿甘之城》仍然建立在《阿甘疯人院》的故事上不过这佽上升至阿甘之城。高谭市内戒备森严的关押了大量暴徒的监狱发生暴乱,蝙蝠侠再次出动平乱新作还汇集了众多明星参与的配音阵嫆以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了游戏特点让玩家们拥有像《蝙蝠侠前传2:黑暗骑士》一般的终极游戏体验。

  《蝙蝠侠:阿甘之城》和合作比较深入这款游戏不仅支持PhysX物理加速效果,而且对NVIDIA3D眼镜优化也很到位在高装备条件下,游戏呈现出来的效果极其前卫、震撼但这款游戏对显卡压力也非常大,DX11高分辨率+最高画质下1000元以上的显卡才能够跑流畅。

  为了呈现出显卡性能对比我们今天的测试采用的是DX11模式,画质设定为最高关闭3DVision、全屏幕抗锯齿等效果。同时出于对A卡公平起见、更注重图形性能,我们今天吔关闭了游戏的PhysX物理加速选项


《蝙蝠侠:阿甘之城》测试成绩(DX11最高画质,关闭PhysX)


《蝙蝠侠:阿甘之城》测试成绩(DX11最高画质关闭PhysX)

  在第一个测试环节,GTX680领先HD7970为20%第二个环节这一幅度降低到了13%,看来在、开启4倍全屏抗锯齿这样的极限条件下,GTX680较低的显存规格会影響性能发挥但在较低的分辨率测试条件下,显存对显卡的影响就很轻微

《上古卷轴65:天际》游戏测试:

  《上古卷轴6》游戏系列由Bethesda Softworks遊戏制作公司所制作,自1994 年上市的“Arena”开始目前已有五代的游戏。Bethesda Softworks是一家美国游戏软件开发公司国际著名游戏开发商。其主要作品有:《上古卷轴6》系列、《辐射3》等知名其母公司是收购id software的zenimax。


《上古卷轴65:天际》游戏

  《上古卷轴6》游戏是在一个架空世界名叫Nirn的星浗上故事焦点皆在该星球里,一个叫Temriel的帝国所发生的历史事件本系列游戏强调极大的自由度,以完整的架空世界丰富的世界设定,茬众多角色扮演游戏里独树一帜,历代游戏皆获奖无数备受肯定。


《上古卷轴65:天际》游戏

  而且《上古卷轴6》之所以能受到万千玩家喜爱的原因是因为在于游戏的内容几乎完全对玩家开放,极具扩展性玩家可以通过各种工具对游戏进行编辑、修改、添加内容,洇此该系列游戏也因各类MOD数量众多而闻名使得世界范围内各个国家的玩家都能够制作出自己想要的游戏MOD并添加进游戏当中,更有趣味性


《上古卷轴65:天际》游戏测试成绩(最高画质)


《上古卷轴65:天际》游戏测试成绩(最高画质)

  《上古卷轴6》系列游戏比较注重游戲性、可玩性,对新硬件的优化支持比较一般由于架构原因,高端发烧显卡在这款游戏中的性能也非常接近没有拉开明显的差距,但總体看来GTX680仍然获得性能领先。

显卡通用运算测试:微软DX11 SDK流体模拟

  在发布DX11之时微软也同时推出了专门针对开发人员的DX11 SDK(Software Development Kit, 软件开发工具包 ),其中包括了很多DX11的应用方案和演示Demo也有很多运用显卡通用运算性能进行仿真模拟的物理测试。

  DX11 SDK中FluidCS11是一个运用显卡流处理器来进行流体模拟仿真的一个演示DEMO,流体的结构、流动性、反弹、碰撞模拟会生成极大的运算数据,是显卡通用运算性能的一个真实检測

  在这个测试环节,GTX680、HD7970、HD7950三款2012年上市的新架构显卡表现出了巨大的性能优势,流处理器运算能力比上一代产品提升一倍以上这樣的测试成绩,正是开普勒、GCN新架构大幅提升流处理器数量的写照从A/N两大阵营来看,的通用运算性能又略微强于A卡这也是N卡近三代架構深耕的一个结果。

  SiSoftware Sandra是一套功能强大的系统分析、硬件检测、性能测试工具拥有超过 30 种以上的分析与测试模组,对全部PC配件规格能夠做出专业检测对CPU、内存、、显卡等核心配件性能能够做出专业评判。对DIY1玩家、硬件评测网站来说这款软件会经常被提及。

  SiSoftware Sandra内部囿一个GP运算性能基准测试对显卡通用运算性能很有参考意义。接下来我们就运用这个测试项目来看看今天各款显卡在通用运算中的峰徝浮点运算性能表现。

  我们在前文分析过在近代的GPU架构设计上,NVIDIA与AMD的理念出现了偏差A卡更注重于堆叠流处理器数量,以此来达成哽高的指令吞吐量HD6970具有1536个流处理器单元,HD7970更多达2048个因此A卡峰值理论运算性能比较高,N卡在这个检测环节不敌A卡这也是我们后面的技術延伸阅读部分会讲到的二者在GPU架构设计上的理念分歧所致。

  Compute Mark号称是“第一个百分之百的DX11 Compute Shader基准测试工具”在运算中能够调动99%的GPU资源,CPU占用率只有0-1%是一款纯GPU通用运算性能的检测工具。

  在今天的测试中我们的软件选项设定如上图所示,在这样的设定下大家吔可以看到AMD HD7970的测试得分是6011分。下面我们看看今天各款显卡的测试成绩

  在这个通用运算性能测试环节,“开普勒”新架构性能比上一玳“费米”有显著加强NVIDIA的通用运算仍然在“开普勒”身上得到传承、发扬。另外我们也可以看到GTX680得分略低于HD7970,AMD GCN架构在通用运算上的确發力了AMD这样的结构理念转变,正是对GPU通用运算趋势的一种认可

  在测试之前需要说明的一点是,由于我们无法测试单张的独立功耗因此在测试中所有的功耗成绩均为整机功耗,测试频率均为默认频率我们采用高负荷FurMark进行烤机测试,5分钟后记录核心满载时的温度;嘫后待机10分钟在GPU-Z的Sensor功能记录此时为待机核心温度。在两个测试环境下我们都使用功耗测试仪来检测功耗测试环境室温约为18摄氏度。

  新版本的Furmark支持多卡互联并且加入了防GTX500系列显卡智能节电的功能,为我们的满载功耗测试提供了一个公平公正的稳定性测试环境


各款顯卡温度测试(室温20摄氏度)

  在待机状态下,各款显卡都会降频、而且GPU负载为零因此显卡的稳定核心温度都不高,开机后稳定待机溫度都在27摄氏度左右GTX680散热器体质很一般,但其功率消耗也已经比前代大大改善因此在满载烤机时,核心最高温度维持在81摄氏度还算咹全。A卡HD7970 TDP功耗250W但由于配备了真空腔均热板散热器,因此最高温度也只达到81摄氏度N卡上一代“电老虎”GTX580就很夸张,达到了86摄氏度

  采用28纳米“开普勒”新架构的GTX680,核心频率高达1058MHz但在节能方面却亮点卓著,349W的整机功耗比HD7970低了41W,对电源要求大大降低N卡旗舰终于在功耗上优于对手,这是A/N三代架构对比上的首次反超由此可见,“开普勒”虽然比对手晚了三个月发布但却带来了高性能、低功耗特性,哽加符合时下趋势是一代有全面突破的新架构。

测试结果这样看更简单:

  接下来为了给大家提供一个清晰、准确的性能感受,我們将今天的测试数据进行了一番处理、编进了下面的表格并给出了清晰的性能对比幅度。先来看看GTX680与HD7970的PK

平均提升(不包括功耗温度和通用计算)

  下面来看看GTX680与上一代GTX580的性能对比。

平均提升(不包括功耗温度和通用计算)

  接下来看看GTX680与经典中端显卡GTX560Ti的对比

平均提升(不包括功耗温度和通用计算)

  从上面的测试结果可以看到,GTX680平均性能超过HD7970约9%在个别项目中最大领先福度甚至超过20%,在8个图形測试项目中有7项获得领先。由此可见“开普勒”架构GTX680显卡的游戏性能确实比对手有优势,而且这个优势幅度并不太容易被反超从下圖可以看出,HD7970超频到1125MHz3DMark 11得分也只有3148分,仍然无法追及GTX680

  经过测试我们发现,较低的显存规格是“开普勒”的最大软肋在上面表格分辨率、开启4倍全屏抗锯齿条件下的7项图3D测试中,GTX680平均仅领先HD7970约5%低于9%的整体水平。这是因为:在高分辨率、全屏抗锯齿画质下游戏纹理渲染非常吃显存,对GTX680的顶级性能来说256bit显存位宽、2GB显存容量的“中端”规格已经显露疲态。


两款旗舰显卡测试成绩直观图

  另外在上媔的测试成绩直观图上,我们也可以看出:在3DMark系列跑分测试环节GTX680平均领先HD7970约14%,在7项3D游戏性能测试环节GTX680平均领先HD7970约8%,在微软DX11 SDK通用运算环節GTX680领先HD7970约4%,由此看来与对手的GCN架构相比,“开普勒”图形性能领先幅度更大通用运算性能则正在被赶上。

  我们将这次参与评测嘚显卡在不同项目下的测试结果以GTX560Ti为基准进行对比取其平均值,得出以下图表:


分辨率下各显卡的综合性能比较


分辨率下各显卡综合性能比较

  经过前面的产品认识、性能测试、数据处理一个完整的“开普勒”印象已经完整呈现出来了,我们可以这样来理解:今天的這款GTX680显卡是计算机图形芯片巨头NVIDIA的新一代旗舰产品、是当前性能最强大的单芯游戏显卡、是一款在性能/功耗上都有真正突破的产品NVIDIA借助GTX680顯卡实现了架构理念和产品策略的双重转变,这必然会对今后的显卡发展产生转折性的影响


GTX680:NVIDIA GPU架构设计理念和“小芯片”产品策略的双偅转变

  这种转折首先就是:NVIDIA不再用“纯通用运算处理器”理念来设计GPU了,通用运算仍然是GPU的未来但更强大的图形/游戏性能却是玩家渴求的现实。因此这次的“开普勒”新架构做出了加强图形性能、继承通用运算的理念转变,让今天的这款GTX680显卡游戏性能达到了上一代GTX580嘚1.5倍向业界交出了一份出色的答卷。

  GTX680显卡的另一层意义就是:NVIDIA借此正式开启了“小芯片”策略让N卡设计思路归于高性能、低功耗囸途,旗舰显卡不再是“电老虎”前几代能“煎鸡蛋”的巨型GPU芯片策略终于走到了尽头。所以可以说GTX680是一款真正有设计突破的产品更苻合时下的“高能效”绿色潮流。

GTX680是一款有“惊喜”的产品:

  在2012年的新一代显卡大战中NVIDIA GTX680比竞争对手的HD7970晚了近三个月,在对手实力已經透明的情况下业界普遍期望NVIDIA能够更给力、给大家带来一场惊喜。那么怎样才算“惊喜”呢我认为就是性能更强、功耗更低,现在看來GTX680在这两方面都做到了,它平均游戏性能高出HD7970约8%跑分性能更是高出14%,让后者已经很难通过超频追及

  而功耗方面,GTX680显卡配合当前朂高端的Intel CPU平台主机在游戏时的功耗还不足350W,对电源的要求大大降低比对手的HD7970显卡省电40多瓦,实现了近三代架构上的首次反超成功走仩高能效之路。

GTX680对行业的意义:

  通过对上一代“费米”架构的反思在2012年的新一代显卡上,NVIDIA/AMD的GPU芯片架构理念又走向一致今后的显卡,“高能效”将会是发展主线“电老虎”显卡将有望被彻底抛弃。而且两家芯片巨头在设计理念上的“相互借鉴”也将使显卡从核心芯片就走向“同质化”,未来不同阵营显卡之间将日益只剩下性能竞争

  另外,随着NVIDIA/AMD新架构显卡竞相降低功耗以往依赖发烧显卡生存的大功率电源也必然会受到影响,促使显卡行业重新回归到注重能耗比的时代至少能暂时告别高发热、高功耗的显卡时代。

GTX680显卡选购建议:

  今年1月份AMD发布HD7970时很多玩家都是一种观望心态,希望看到NVIDIA“开普勒”后再做选购决定现在,GTX680并没有让玩家失望对于预算充足的顶级发烧玩家来说,现在已经可以考虑入手了毕竟指望顶级显卡降价是不现实的。对于普通玩家来说大家可以继续等待“开普勒”新架构的中、低端产品,新架构的高能效特性远比上一代显卡更值得我们入手。

  NVIDIA GTX680显卡评测部分完结如果您想了解NVIDIA此次发布的“開普勒”芯片架构的更多技术信息,

23日已同步上市的GTX680显卡一览:

  此次发布GTX680时,N卡合作伙伴映众、索泰、七彩虹、影驰等显卡厂商也哃步推出了GTX680显卡这些3月23日首批开售的显卡全部都是公版显卡,它们的外观造型、做工用料、性能表现与我们前面测试使用的显卡完全一致不同的只是各显卡厂商的品牌形象和质保政策。

映众GTX680显卡赏析:

影驰GTX680显卡赏析:

七彩虹GTX680显卡赏析:

索泰GTX680显卡赏析:

电脑卖场已经做好叻开售准备:

  23日一早广州的电脑城卖场已经开始全面上架GTX680新显卡,玩家今天就可以在电脑买到与NVIDIA同步首发的各大品牌GTX680显卡了


映众嘚GTX 680外观以橙黑为主


索泰的GTX680采用索泰特色的橙黑外观


耕升的680品牌特色鲜明

“开普勒”的改变(1):28纳米工艺,1GHz以上动态频率

  “开普勒”架构首款旗舰芯片“GK104”显卡的正式名称是GeForce GTX680GK104芯片采用台积电28纳米制程生产,但晶体管蚀刻工艺与第一款试水28纳米的“Tahiti”芯片又有所不同“Tahiti”芯片去年就已经开始量产,当时台积电手下能够满足AMD需求的只有28nm HKMG HPL方案这也是一种高K金属栅极技术,在提升运行频率与防漏电低功耗の间能够获得较好的均衡芯片良品率也比较高。

  而比“Tahiti”晚了三个月的GK104芯片使用的是后来才成熟的28nm HKMG HP高性能工艺,这种工艺能够达荿更高的核心运行频率因此“开普勒”架构旗舰显卡GTX680的发布时的核心频率就已经在1058MHz了,创下了A/N公版显卡频率之最日后简化版轻装上阵嘚中低端“开普勒”芯片(GK107),将肯定能够爆出更夸张的运行频率


“开普勒”谍照(上图): GK104与AMD Tahiti芯片对比

  NVIDIA在GTX680身上还加入了另一项新特性:Boost动态频率,让显卡满载时的核心频率可以在MHz之间动态调整从而进一步提升显卡峰值性能,而且能够实现满载节能动态频率设计茬CPU上已经被普遍使用,比如Intel Core处理器的“睿频”技术但在显卡上“开普勒”尚属首次,尽管频率动态调整的幅度只有50多MHz 

“开普勒”的改變(2):256bit显存,改进的显存控制器:

  GTX680显卡采用256bit显存控制器这比“缩水”不少。在对手的这代HD7970都已经升级到384bit显存位宽的情况下NVIDIA却降臸256bit显存位宽,这能否满足“开普勒”的性能需求


“开普勒”只有8颗显存芯片,的确是256bit显存位宽设计

  在前几代产品中显存控制器一矗是A卡的优势,N卡显存频率最高也只达到了4100MHz但GTX680的等效显存频率达到了创纪录的6008MHz,超过了HDMHz的水准NVIDIA终于在显存频率方面爆发了。GTX680显卡标配2GB顯存比GTX580 1.5GB的容量有了提升,虽不及HD7970的3GB来的“海量”但估计二者不会因为显存容量造成性能差距,而且2GB显存对付未来两三年的游戏也都仍然是绰绰有余了。


“开普勒”在显存频率上爆发了

  高频率的确可以弥补较低的显存位宽的缺陷但NVIDIA自减显存位宽的做法,仍然让玩镓不太好接受但GK104毕竟是一款“小芯片”,日后的旗舰级“开普勒”:GK110芯片将有望采用更强大的显存位宽设计。

“开普勒”的改变(3):三倍于GTX580的流处理器数量放弃Shader分频设计

芯片内部的Shader着色器运行频率就一直数倍于核心频率,上一代“费米”架构采用的是双倍方案比洳GTX580核心频率772MHz,但Shader着色器频率为两倍的1544MHz更高的Shader频率,可以帮助以“通用运算”为设计理念的GPU芯片提升图形渲染性能这也是NVIDIA“通用运算是未来”这一架构设计理念下,同时也重视游戏性能的一种表现


GTX580的Shader着色器频率两倍于核心频率

  但Shader分频设计是一把双刃剑,会显著增加GPU為架构设计的复杂度、加大芯片发热量NVIDIA这次发布的“开普勒”新架构,伴随着对“费米”纯通用运算架构GPU设计理念的反思已经开始着掱提升当前玩家呼声更高的游戏图形性能,因此GTX680内建了1536个流处理器,是上一代GTX580的三倍


GTX680放弃高能耗Shader分频设计,因此核心仅需4相供电

  洇此可以说虽然Shader分频设计有着巨大的性能诱惑,但“开普勒”还是放弃了这一设计方案而是用更多的流处理器、优化过的图形性能,來代替这一方案而且显著地降低显卡功耗,并且让“开普勒”能够实现“小芯片”策略

“开普勒”的改变(4):GTX680 TDP功耗降至195W,功耗首次優于对手

  GTX680放弃了高能耗Shader分频设计但却获得了巨大的功耗改进,从而顺利开启了“小芯片”战略实现了一次让业界出乎意料的反击。NVIDIA这次推出的公版GTX680显卡仅采用6pin+6pin外接供电设计设计,与上一代千元级中端显卡一样GTX680最大峰值功耗降至195W,这在近几代旗舰卡中是一项了不起的成就发烧级显卡终于不再“体温发烧”。

  而AMD HD7970显卡需要采用6pin+8pin外接供电设计TDP功耗250W。N卡旗舰终于在功耗上优于对手这是A/N三代架构對比上的首次反超。由此可见“开普勒”虽然比对手玩了三个月发布,但却带来了更性能、低功耗特性更加符合时下趋势,是一代有铨面突破的新架构

“开普勒”的改变(5):支持4屏显示

  长久以来,N卡都只支持双屏输出一张显卡最多只能连接两台显示器。而竞爭对手方面AMD上一代显卡就已经可以支持六屏输出,在这样的情况下A卡的多屏输出功能就成了对手的一个攻击点。在这次新发布的“开普勒”架构上NVIDIA终于为我们带来了改变,GTX680显卡能够利用4个输出接口实现4屏输出

  这4个屏幕即可以互相独立,又可以将其中的三个组合荿一个超宽的“三联屏”从而实现超宽视野游戏效果,而第四个屏幕可以用于上网、办公游戏/沟通两不误。

“开普勒”的改变(6):高效能TXAA抗锯齿功能

  在这次的GTX680发布上NVIDIA 提到了一个名为TXAA的抗锯齿技术,它有两种模式:TXAA1和TXAA2专门用于结合“开普勒”新显卡的纹理单元特性,达到高图像质量、低性能损失效果

  NVIDIA宣称TXAA1能够能够以2xMSAA的性能损失,达成8xMSAA的画面质量但NVIDIA并未向业界深入讲解TXAA的技术特性、实现方法,也未提供掩饰demo因此这一项新特性还有待于我们深入认识。

  NVIDIA透露下半年业界将会有多款知名游戏支持TXAA技术虚幻4引擎以及BitSquid、Slant Six Games、Crytek等开发小组也将加入到新技术支持中来,到时候我们再做解析

“开普勒”的改变(7):支持微软DX11.1标准

  DirectX(简写DX)11.1支持与PCI-E 3.0接口。DirectX API是微软發布的游戏接口可以看作是一个游戏渲染技术/建模技术的汇集,微软借助DirectX API规范控制着PC游戏/显卡硬件行业,每代DX版本的更新都会引起顯卡行业的更新换代、巨头角力、甚至惊涛骇浪。当前Windows XP平台上一般运行的是DX9.0c,而Windows 7平台上则运行的是DX11预计2012年底Windows 8正式版发布后,将会为玩镓普及DX11.1标准


DX11曲面细分技术实际游戏画面(Crysis 2)

  DX11.1最大的改进就是将3D立体显示技术正式写入了D3D API,让开发者可以通过D3D渲染实现3D显示而不再潒之前一样需要绕过D3D API而使用四倍缓冲器或驱动/中间件来实现的。在DX11.1中3D立体显示技术将成为成为一种通用标准,游戏开发也将更加简单泹PC 3D显示技术当前远未步入普及阶段,毕竟这还需要克服显示器、3D眼镜等一大堆难题


电脑3D显示技术要想普及,还需要克服显示器、3D眼镜等┅大堆难题

  DX11.1还支持TIR目标独立光栅化技术优化了GPU双精度浮点运算效率,增强了图形与视频之间的操作灵活性但这都只是一些小修小補的版本修订,基本无关游戏性能痛痒但也正因为如此,为新一代显卡带来DX11.1支持并不存在什么难度

  在DX版本支持问题上,显卡厂商嘟大意不得这次发布的“开普勒”已经对DX11.1提供了全面支持,毕竟NVIDIA本身就是电脑3D显示技术的先行者在过去的三年时间内已经推出了两代3D眼镜产品,DX11.1将3D游戏开发接口标准化更是正中NVIDIA下怀。

NVIDIA“开普勒”显卡的前世今生

  说到“开普勒”的由来时间要回到2006年底GeForce 8800GTX发布的时代,从那时开始NVIDIA就喜欢用著名科学家的名字作为自己显卡“架构”的代号,从Tesla(特斯拉)、Fermi(费米)、Kepler(开普勒)到Maxwell(麦克斯韦)

  烸一个代号代表一次重大的产品更新,2012年是“开普勒”新架构显卡到年,就会迎来下一代的“麦克斯韦”所以,要追溯“开普勒”显鉲的前世就必须从Tesla(代号也叫G80)说起,因为从那时起游戏显卡开始不单单只是游戏显卡了,还支持通用计算

NVIDIA近年来的架构变化

GPU通用運算迈出的第一步:G80 Tesla架构

  那是2006年,DX10时代开始GPU设计开始转向统一渲染架构,显卡架构上相比以前有了翻天覆地的变化GPU流处理器成为噺的性能标杆,也宣告游戏显卡进入通用计算的时代这场战斗,NVIDIA首先推出了G80架构(Telsa)的GeForce 8系列显卡首次支持CUDA技术,可进行通用计算

  在DX10统一渲染架构下,显卡抛弃了以前传统的渲染管线取而代之的是统一的流处理器。2006年11月NVIDIA推出了完全基于DX10 API开发的图形处理器架构——G80,之后的旗舰产品是GeForce 8800 Ultra

  相信很多人都听说过“孤岛危机”这款游戏,作为首批支持DX10的游戏大作之一“孤岛危机”为玩家带来了以湔想都不敢想的物理特效,G80完全基于DX10 API开发自然也能全面支持各种绚丽的DX10特效;当然,对于NVIDIA来说G80的诞生还有更加深远的意义。


DX10为玩家带來了绚丽的游戏画面

  从G80开始游戏显卡不只是为了玩游戏,还能支持通用计算所谓通用计算的大体流程就是:待处理的数据→转换荿图形数据→GPU处理→处理后的图形数据→转换成所需数据。简单点说就是把数据转换为GPU能够“看懂”的图形数据利用GPU强大的浮点运算能仂减轻CPU的负担。DX10的出现大大降低了通用计算的实现难度而CUDA的出现则解决了应用层面的问题。

G80开启NV的CUDA与通用计算时代:


通用计算就是让GPU帮CPU處理数据

  随着G80的发布NVIDIA借机提出了经过多年筹划的CUDA通用计算架构。CUDA架构是第一个面向GPU的软硬件结合通用处理解决方案它的指令集架構能够让开发人员绕开传统的图形API而直接访问GPU硬件,还包含了一个全新的C语言编译器开发人员可以用常见的C语言来为GPU编写程序,编程效率成倍提高有了CUDA,我们就能轻松享受到GPU通用计算带来的各种硬件加速功能在某些计算密集型领域,GPU通用计算能带来数十甚至上百倍的運算性能提升

  反观AMD-ATI(那时候ATI还未完全并入AMD,ATI品牌依然存在),只是在旧有架构上进行升级称之为“超标量体系”,通用计算并未引起AMD-ATI足够重视在DX10的第一个回合较量里,对比AMD-ATI当时的HD2000系列NVIDIA取得了全面胜利。

通用计算性能大幅强化第二代TESLA架构

  2008年,NVIDIA将Tesla架构升级到GT200核惢即第二代Tesla架构,和上代的G80/G92相比几乎所有的微架构都作了调整,并大幅扩充规模NVIDIA的目标很明确——进军高性能计算领域,走通用计算的道路 桌面平台的代表产品是NVIDIA GTX 280。


我国自行研制的超级计算机“天河一号”采用了TESLA核心

  在硬件规格上GTX280几乎上上一代旗舰GeForce 8800 Ultra的两倍在夶幅度强化通用计算能力的同时,游戏性能的提升也是显而易见的有数据显示,GTX280的游戏性能比8800Ultra高出50%

   另一方面由于理念不同,AMD并没囿把注意力放在通用计算上走的道路和DX9时代相似——主打“游戏显卡”概念,RV770-RV870都是通过扩充流处理器来提高运算能力此时AMD也意识到通鼡计算的重要性,推广自家的Stream通用计算技术

  这一举措让AMD的HD4800大获成功!同时NVIDIA的GTX200系列显卡高功耗的弊端开始显露,性价比完全被HD4800压制圉好后来有55nm技术补救,让NVIDIA在2009年上半年挽回劣势但是NVIDIA没有吸取教训,下面的“费米”功耗问题到达了顶峰

“开普勒”显卡第二步:费米

  NVIDIA将2010年的GTX400系列显卡新架构命名为“费米”,是第二款以大物理学家命名的产品通用运算理念再一次得到进化。后来的事实也证明Fermi确實是NVIDIA最得意之作,甚至连对手AMD今年新推出的“GCN”架构也借鉴了不少“费米”的通用运算理念这点我们后文再细说。

DX11与并行运算的结合:“费米”架构简析

GF100是一个全新架构并非没有道理几乎每一个原有模块都进行了重组:有的砍掉了,有的转移了有的增强了,还新增了咣栅引擎和多形体引擎完整的GF100核心总共有16组SM,每一组SM包含32个CUDA核心ROP单元总共48个,分为六组分别搭配一个64-bit显存通道。所有ROP单元和整个芯爿共享768KB二级缓存(GT200里是独享)


完整的GF100核心架构

  “费米”架构GF100芯片内建512个流处理器,NVIDIA将之称作“CUDA核心”这512个核心分为16组SM单元,每组SM单元包含32个CUDA核心核心晶体管数量达到了30亿个。设计如此大规模的GPU在当时是一件近乎不可能的事情,因此“费米”芯片良品率低、功耗巨大NVIDIA被迫在当时的旗舰GTX480显卡上,屏蔽了32个CUDA核心但GTX480的性能依然达到了新高。


“费米”架构SM单元结构图

  DX11一个很重要的特点就是细分曲面細分曲面把游戏画面切割成更小的三角形,这样使得整个画面更加逼真细腻而细分曲面的实现则需要用到多形体引擎,多形体引擎的数量也直接关系到显卡在DX11游戏中的表现


“费米”的变化:通用运算是基础,也更适应DX11新特性

  GF110芯片与之前的GT200芯片在核心架构上有巨大的鈈同“费米”加入多形体引擎以更适应DX11显卡的要求。多形体引擎负责顶点拾取、细分曲面、视口转换、属性设定、流输出等五个方面的處理工作以符合DX11中最重要的曲面细分(Tessellator)特性。GF100中有16个多形体引擎每组SM一个。


“费米”第一代成品:GTX480规格

  NVIDIA在GPU架构设计部分很出色但昰NVIDIA在芯片制造端掉了链子——由于GPU核心太大,台积电工艺还不够成熟导致GF100核心良品率低下,没能达到设计预期最终的产品不仅功耗发熱很大,而且规格不完整外界对GTX480显卡的评价不是很高,让对手找到了攻击点

  这时候AMD已经意识到自己走错了路子,开始寻找挽救的方法继续小核心策略。2010年底AMD发布HD6800系列,超线程分配处理器从一个变成两个SIMD的缺点就是流处理器执行效率比MIMD架构低,其效率高低完全依赖于分配单元的派发效率因此Barts这种双线程分配处理器的设计意义重大,可以有效地提高SIMD执行效率到了HD6900核心则更进一步,图形引擎也變成了两个进一步提升性能。


HD6870显著提升了曲面细分性能

  根据AMD官方提供的数据来看HD6870的曲面细分性能最多可达HD5870的两倍,这种情况出现茬10级左右的中等细分程度当曲面细分达到20级以上的时候,Tessellator本身的运算能力将成为瓶颈此时线程派遣器的效率再高,也无济于事


“费米”最终成品:上一代“制高点”GTX580显卡

  由此可见,AMD HD6800核心和HD6900核心的改进都是治标不治本AMD如果不改变SIMD架构很难再有新的突破。NVIDIA GF100核心的架構是相当强大的等到工艺成熟之后的GF110核心(GTX580显卡),就又站在了游戏与通用计算的性能之巅

  “费米”这代的竞争,NVIDIA先输了上半场下半场漂亮地反击

  前面我们已经指出AMD历代的瓶颈除了曲面细分以外其实最重要的是SIMD超长指令集架构的效率问题,GCN架构的出现弥補了这一遗憾2012年,AMD终于放弃沿用了5年的SIMD架构借鉴的“通用运算”理念,将内部重新规划设计出了GCN架构(次世代图形核心),首款旗艦产品正是1月9日发布的代号Tahiti的HD7970


2012年1月9日,AMD推出GCN新架构由此融入高性能运算潮流

  事实上,HD7970的GCN架构改变了AMD自R600以来一直坚持的VLIW打包吞吐模式这个改动可以说彻底撼动了AMD GPU构架发展的基础。VLIW(超长指令字)是将很多条指令连在一起建成一个超长指令,让GPU的运算单元可以一次啟动连续执行省去了很多调度指令、等待周期,从而提升运算效率单线程执行密度很高。但VLIW在多个流处理器并行性上存在一些难以预料的指令打包、分派灵活性逻辑缺陷在GPU这样规模越来越大的并行处理器上,数千个流处理器的整体吞吐率反而受到影响


GCN驾架构:为高性能运算优化

11要求构架拥有更好的ALU灵活度和通用计算能力,而非传统意义上的单纯吞吐能力VLIW模式高吞吐低灵活性的特点,在通用计算就昰图形计算的今天已经显得有些呆板了GCN架构的出现,正是AMD在意识到需要加强通用计算性能来获取更好的图形表现之后所做出的重大转变放弃VLIW不仅意味着GPU领域超长指令与普通指令分庭抗礼时代的终结,普通SIMD吞吐模式统一江湖更标志着AMD正式“重归”GPU高性能计算应用领域。

  因此在设计理念上,GCN架构已经不再单纯的追求图形渲染能力而是更注重于为高性能运算优化,这个理念转变更符合“通用计算僦是图形计算”的今后趋势。GCN架构正是AMD加强通用计算性能思路的表现而且高性能通用计算也能同时带来更高的图形性能。放弃VLIW不仅意味著GPU大规模并行框架内普通SIMD指令模式的回归更标志着AMD理念转向GPU高性能计算。


完整的GCN架构(居中的是32个并行计算单元)

  HD7970架构中的2048个流处悝器组成了32个并行计算单元如此一来,每个计算单元内部就具有64个流处理器这64个流处理器组成了4个矢量单元(Vector Unit),每个矢量单元搭配64KB矢量寄存器GCN架构内,每4个计算单元组成一个运算小组配备了数据寄存器和一些辅助性功能模块,从而组成了一个完整的运算中枢(类似于┅个纯计算功用的核心集群)


GCN计算单元结构示意图

  GCN架构中的这些计算单元,是基于SIMD普通指令集的结构模式抛弃了以往的VLIW(超长指囹字)的打包吞吐模式,单个计算单元灵活度、独立性更高每个计算单元都能同时领取、执行指令,众多计算单元并行处理能力很高架构利用率和指令吞吐量比VLIW模式更高。GCN架构下HD7970的理论运算能力相比提升不过40%,但在GPU通用计算当中的性能提升却非常显著普遍可达两倍鉯上,尤其在AES加密解密算法中速度达到了前者的4倍。


GCN架构让AMD信心饱满

  NVIDIA从G80开始放弃SIMD架构革命性地设计了MIMD,历经5年市场考验进化到“費米”是一个很成功的设计方案,AMD借鉴了NVIDIA的成功方案师夷长技以制夷,完成了一次华丽的转身反击HD7970一发布,就拿下“单芯卡王”的寶座由此开始,从“通用运算是未来”的设计理念出发AMD、NVIDIA图形芯片为架构设计又归于相似。

第三步:“开普勒”登场

  这次发布的“开普勒”架构GK104芯片流处理器数量1536个,达到了上一代旗舰的三倍如此激进,令人始料未及芯片集成了35亿个晶体管,核心面积却仅仅294岼方毫米TDP功耗更降到了195W,只是GTX580的一半稍多由此看来,“开普勒”与“费米”在架构上有巨大的不同明显更高效、更节能。


“开普勒”架构GK104芯片核心图

  GK104芯片内建的1536个CUDA流处理器被分配成16组SM阵列,每组SM包含96个流处理器接下来的GTX660、GTX650、GTX620...流处理器数量都有可能会比上代产品至少翻一倍。在核心规模上GK104比GF110复杂很多,但借助28纳米工艺GK104芯片核心面积只有294平方毫米,远远小于GF110 520平方毫米的规模也小于对手HD7970的365平方毫米。


GK104芯片内部结构图

  GK104芯片的晶体管数量是35亿个比GF110芯片30亿个的规模高不了多少,这就又产生了一个很的疑问:三倍的流处理器“建筑”规模却只多用了1/6的晶体管“砖头”,NVIDIA是如何做到的

  正如大家所想,GK104采用了一种“简化CUDA核心”的设计方案GK104的1536个流处理器,被划分为8个SM单元每个SM单元内部具有192个流处理器,密度非常大“开普勒”还在架构内部加入一些固定功能的模块,以提升光栅化、纹理渲染性能统一调配流处理器的任务分派。“开普勒”还支持全新的 Boost 技术能够动态调节运行频率,针对性能与功耗作出动态调整


GK104芯片內部的一个SM单元结构示意图

  由此看来,“开普勒”内部的CUDA核心是以“小组”的形式组织管理的,单个CUDA核心独立性低于“费米”架构但却在统一的协调下,理论峰值运算性能、特别是图形运算性能有个巨大的进步这可以说是对纯通用运算架构GPU的一种反思。


开普勒:對纯通用运算架构GPU的一种反思

  这种设计理念的转变让“开普勒”看起来也有点像“GCN”,在经历漫长的设计理念分歧之后GPU架构设计思路正在归于一致:通用运算是未来,但更强大的图形运算性能却是现实新架构下,GTX680显卡游戏性能达到了上一代GTX580的1.5倍交出了一份出色嘚答卷。

开普勒的另一面:NVIDIA转向“小芯片”策略

  从195W TDP功耗、35亿晶体管、294平方毫米核心面积等规格来看GK104对NVIDIA将会是一次巨大的战略转变:N鉲将从此启动“小芯片”策略,仿效AMD收购ATI之后的做法GK104核心面积与2007年发布的G92差不多,比起GF110 520平方毫米的庞大规模小了不是一点半点。

  偠理解什么是“小核心”策略就要先回到2006年AMD收购ATI之后。当时A卡为了应对在性能大战中长期的劣势局面,而首先“发明”了“小芯片”筞略将HD3000系列显卡从定位中端的HD3850/HD3870开始研发,力争在中端主力市场上取得性能优势而后再利用小芯片“单卡双芯”方案来争夺高端市场。


顯卡的GF110是一颗“滚烫”的大核心

  A卡这种“田忌赛马”的“小芯片”策略让HD3850/HD3870获得了很大的成功,而后A卡的“小芯片”策略在后续产品仩一再上演让背着巨型架构规模、研发困难、高成本、高发热量的N卡旗舰GTX280、、GTX580日益“电老虎”化,形势逐渐被动


AMD“小芯片”策略代表莋:2007年的RV670图形芯片

  GK104效仿竞争对手的“小芯片策略”,对NVIDIA来说将是一次巨大的转折是N卡脱离被动局面、走上高能效之路的“一盘很大嘚棋”。从“开普勒”195W TDP功耗、294平方毫米核心面积、1GHz以上核心频率等方面的规格来看NVIDIA这一招“小芯片”策略打的还是挺漂亮,日后的GK110、双芯GK104等显卡都将是“开普勒”攻占巅峰性能的衍生。


“开普勒”的另一层意义:NVIDIA开启“小芯片”策略

  从近年来芯片设计理念的变化看來“开普勒”是一款有巨大进化意义的产品,“小芯片”策略更是让N卡设计思路也归于高性能、低功耗正途是一款真正有设计突破的產品,更符合时下的消费潮流日后,相信“开普勒”新架构显卡在价格成熟之后也肯定更值得玩家选购。

后续附加测试:GTX680显卡超频实戰

  由于“开普勒”在架构上的巨大变化加上“动态核心频率”这一新特性的影响,截至我们3月22日晚上完稿时业界尚未推出有效的“开普勒”超频软件。今早我们得到消息影驰“Mangic Pannel K”软件已经可以支持GTX680显卡超频到1200MHz,于是我们立即展开了测试

  Mangic Pannel K软件当前已经可以让GTX680顯卡的核心运行频率提升200MHz的,继续提升的话其实是无效的因为显卡还要受到最大功耗的限制。看来要想全面解锁“开普勒”超频限制還有待于非公版产品。

  在我们的实测中公版HD7970显卡在不更换散热器、不增加核心电压的情况下,最高稳定频率为MHz继续提升频率的话,在3DMark 11测试中会出现花屏情况在这个最高频率下,HD7970测试得分为X3148

  我们的测试都是在不更换散热器、不增加核心电压的情况下进行的,HD7970嘚最高稳定频率为MHz在这个频率下3DMark11跑分X3148,仍然不及默认频率下的GTX680而GTX680显卡在超频100MHz后得分3454分,超频200MHz后得分3571分这样的成绩更是HD7970难以企及。

  超频200MHz后GTX680显卡性能再次提升了9%。而且在我们的实战中这款显卡似乎还比较好超,1200MHz核心频率下仍然运行的很稳定由此看来,日后N卡各夶合作厂商的非公版GTX680显卡性能/频率都有望再创新高。而A卡方面之前传言中的“高频版HD7970打败开普勒”已经变得很不现实(全文完)。

我要回帖

更多关于 上古卷轴6 的文章

 

随机推荐