新闻中心

News
您当前的位置:首页 > 新闻中心 > IT头条 >七彩虹战斧RTX 4090显卡评测
七彩虹战斧RTX 4090显卡评测
作者:成都服务器总代理   来源:转自IT168   点击:   时间:2022-11-22 15:44:03
自Turing图灵架构伊始(即GeForce RTX20系列),NVIDIA 显卡正式进入RTX实时光线追踪及DLSS深度学习超级采样技术时代。回顾当初,质疑声音不少,光追效果一般,DLSS折损画质,支持的游戏屈指可数。在接下来的日子里,NVIDIA潜心修炼内功,Ampere安培架构(GeForce RTX 30系列)的强悍表现让许多的质疑者成为了支持者。

  今年以世界上一位女程序员Ada Lovelace为名的新架构正式亮相,属于GeForce RTX 40系列显卡的时代正式到来。TSMC 4N NVIDIA定制工艺, 新的全景光线追踪以及新一代的DLSS 3技术……在游戏画质与流畅度再一次拥有质的飞跃。

  GeForce RTX 40系列显卡首发三个型号:GeForce RTX 4090/GeForce RTX 4080 (16GB版本)/GeForce RTX 4080(12GB版本)。今天,七彩虹战斧GeForce RTX 4090豪华版显卡,借助它来带您详细了解新一代显卡的具体性能表现。

  NVIDIA Ada Lovelace架构分析:

  1、内部的架构:GPC规模猛增

  七彩虹战斧GeForce RTX 4090豪华版显卡采用的是AD102-300核心,这并不是完整版。完整形态的AD102核心包含12个图形处理集群(GPC),从Ampere的7个猛增至12个,光凭这一点,就能带来很强的性能提升。此外,还包含72个纹理处理簇(TPC),144个流式多处理器(SM),搭配12个32bit的显存接口(共计384bit)。

  上图为SM单元,AD102中每个SM单元包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)。还包含16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core,因此共计32个CUDA。当然少不了1个第三代RT Core,4个第四代Tensor Core,4个纹理单元(Texture Units),256KB寄存器堆,以及可根据需求进行配置的128KB L1共享缓存。

  2、第三代RT Core:带来全景光线追踪

  七彩虹战斧GeForce RTX 4090豪华版显卡从第二代RT Core升级到第三代,从两代架构对比来看,第三代RT Core架构增加了微映射透明度(Opacity Micro-Map,OMM)引擎和微网格置换(Displaced Micro-Mesh,DMM)引擎。除此之外,还对L2缓存上进行了升级,配置98304KB的L2缓存,比Ampere 提高16倍。这些都让光线追踪性能获得巨大收益。

  3、着色器执行重排序:提高光追效率

  在接近真实场景的实时光线追踪中,多样化的环境变化意味着本应重要的原始处理工作量会越来越少,反而像反色、间接照明、半透明效果的二次折射等计算会占据大量的着色器资源,让着色器忙碌在无意义的二次反射、漫反射等场景中,导致效率降低。如果不加以解决,GPU以有序性常规执行方式会非常低效。

  为此,七彩虹战斧GeForce RTX 4090豪华版显卡引入了【着色器执行重排序(Shader Execution Reordering,SER)】功能,能够让着色器更智能的安排每一项工作的重要程度,从而能大大提高渲染的效率。SER可以为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。

  4、第四代Tensor Core:AI计算效能倍增

  七彩虹战斧GeForce RTX 4090豪华版显卡从第三代Tensor Core升级到第四代,新一代Tensor Core的FP16、BF16、TF32、INT8、INT4性能相对前一代提升两倍以上,实现AI计算性能大幅度提升。

  5、DLSS 3 : 真正的帧率收割机

  DLSS 3绝对是七彩虹战斧GeForce RTX 4090豪华版显卡亮眼的技术。DLSS 3包括了全新的帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术。

  DLSS本质通过深度学习算法将单帧的低分辨率提升成高分辨率,让游戏帧率获得大幅度提升。但这还不够,在DLSS 3上,利用光流加速器与DLSS相结合的办法,构建一个更为立体的分析方式:之前的帧与当下帧,由光流加速器生成光流场、游戏运动矢量和深度等数据,DLSS将新渲染的帧与之前的帧进行比较,并考虑运动矢量与光流场信息,了解场景变化,从而生成一个全新高质量帧。简单的理解,AI生成帧不需要占用太多GPU资源,是由AI计算出来的。

  DLSS 3在光流加速器的搭配下实现了脱离GPU渲染重建高分辨率方法,让GPU渲染的部分大幅减少,以两帧为例,DLSS 3会承担起第一帧的3/4的工作和第二帧的所有工作,实际上GPU只需要完成其中的1/8的渲染即可,从而节省了大量的计算资源。

  DLSS 3也并非传统意义上的单一技术,事实上它是一个软件与硬件协同的集合。在软件层面,DLSS 3使用AI超分辨率生成,AI生成帧,加入对NVIDIA Reflex支持。在硬件层面,DLSS 3需要在第四代Tensor Core上运行,并利用改进的光流加速器帮助DLSS 3像素级的测量场景,云端的NVIDIA超级计算机则夜以继日的寻找提升高质量图像的途径。上述六种软硬件结合,终实现了DLSS 3的高质量表现。

  目前已经超过35款游戏和应用支持DLSS 3,包括寒霜引擎、Unity 、虚幻引擎4 & 5 等游戏开发引擎,《赛博朋克2077》、《逆水寒》、《微软模拟飞行》、《瘟疫传说:安魂曲》等热门游戏大作,未来支持DLSS 3的游戏会越来越多。

  RTX 4090显卡的规格:

  GeForce RTX4090显卡用上TSMC 4N NVIDIA定制工艺,由台积电5N改进而来。AD102核心面积没有增加的前提下,晶体管数目爆涨,从283亿个提升至763亿个。流处理器方面,GeForce RTX 4090达到16384个,相比GeForce RTX 3090 Ti提升34%。同时第四代Tensor Core和第三代RT Core的数量,相比GeForce RTX 3090 Ti都有大幅度增涨。

  GeForce RTX4090显卡核心Boost频率达到2520MHz,比GeForce RTX 3090 Ti的1860MHz高得多,后续如果经AIC厂商调教,轻松超过2.52G。显存来自美光定制GDDR6X,24GB满配,显存带宽超1TB/s峰值。

  功耗方面,GeForce RTX4090与GeForce RTX 3090 Ti保持一致,都是450W,这出乎很多人的意料,这也从侧面证明Ada Lovelace架构GPU能耗比的巨大飞跃。

  至于价格上,GeForce RTX 4090官方建议零售价12999元,比GeForce RTX 3090 Ti便宜2000。当然12999只是公版指导价,非公版显卡价格要贵一些。

  战斧GeForce RTX 4090豪华版的规格:

  ▲七彩虹战斧GeForce RTX 4090豪华版的GPU-Z信息

  七彩虹战斧GeForce RTX 4090豪华版设定的Boost频率为2565MHz,比公版的2520MHz,高了45MHz。功耗设定450W,峰值功耗则在480W,功耗也保持一致,理论上性能跟公版一致。如果搭配旗舰型号的CPU,推荐1000W或以上电源比较稳妥。

  七彩虹战斧GeForce RTX 4090豪华版显卡介绍:

  产品的外包装,印有一把战斧,右下角标识着产品型号GEFORCE RTX 4090。

  整体采用黑与红的撞色设计,金属外观,经磨砂工艺处理,非常有质感。钻石状三角元素,起到点缀作用,也彰显了力量感。

  区别于旧款战斧,战斧豪华版全新的造型,方正硬朗,肌肉感十足。很酷,也很强!

  由于性能增强,供电与散热也要强化,GeForce RTX 4090的体积又增加了。七彩虹战斧GeForce RTX 4090豪华版尺寸为长817.5000000000001px,宽度377.5px,厚度为167.75px,跟以前20系列显卡相比,几乎大了一圈。

  妥妥要占据三个PCIe插槽,对机箱兼容性要求可不低。

  全金属背板设计,尾部同样做了镂空处理,方便空气的对流,利于通风散热。

  七彩虹战斧GeForce RTX 4090豪华版显卡采用了利斧散热器,正面设计三个98mm的大风扇,实现更强的风压以及更大的进风量。

  战斧散热器内置2根6mm和4根8mm的镀镍热管,大面积液冷均热板和散热鳍片,保证高负载场景下,快速驱散热量,保证显卡性能稳定发挥。

  供电接口为新型的16Pin(12+4Pin)PCIe5.0供电接口,12pin为供电口,另外4Pin负责信号传输,单口可以承载600W功耗。

  使用ATX3.0标准的电源,只需一根供电线即可,看着比过去3个8Pin口简洁多了。

  如果您使用的不是新款ATX3.0电源,没有16Pin供电口,随显卡附赠一条转接线,3个8Pin转16Pin,可与旧款电源兼容。

  侧边的隐藏式LOGO RGB信仰灯,通过新款iGame Center软件,可以进行灯光设置。

  不同的灯光效果,让机箱内部更多彩。

  接口上,提供一个HDMI2.1和三个DP1.4a。其中HDMI2.1接口可支持8K@60Hz视频输出。

  顺便提一款有意思的“玩物”,随七彩虹战斧GeForce RTX 4090豪华版显卡一起送测的,还有这款拼奇积木联名的iGame奇趣主机。

  这款奇趣主机是由主机、主板、内存、显卡几大部分积木组装而成,喜欢DIY硬件的小伙伴们,用它也能体验一回装机乐趣,或者新手朋友,先自己尝试尝试DIY电脑过程。

  新款iGame Center软件:

  七彩虹显卡专用的集成控制软件iGame Center同步更新到了新版本,整个软件进行深度优化,不仅界面更清晰明了,功能也更加丰富。

  搭载七彩虹RGB硬件,在这里可以对全局灯光进行控制。有不同灯效模式,也可以对灯光的速度,亮度,方向等进行调节。

  除了灯效同步,还能单独对显卡的灯光模式进行调节,可玩性还是挺高的。

  灯光控制的另外一栏则是超频控制,在这里可以调整显卡的核心频率,显存频率,电压,温度及功耗等。

  在监控日志里,可以控制LCD屏幕的各种显示功能,不过战斧系列并没有配备LCD屏幕。

  新款iGame Center软件加入玩家俱乐部,以增加玩家的粘性。

  测试平台介绍:

  测试平台如上,CPU使用i9-12900K,搭配一块Z690 D5主板,内存则是DDR5-6000高频,16GBx2双通道。

  七彩虹战斧GeForce RTX 4090豪华版显卡的峰值功耗在480W,而i9-12900K的满载功耗接近260W,光显卡+CPU这两项功耗值740W,考虑到40%的冗余功耗,以此保证一些高负载情况下正常运行,我们使用了航嘉新款MVP P1200 ATX3.0电源,额定功率1200W,一步到位保证平台的稳定供电。

  基准性能测试:

  以3DMark作为显卡基准测试软件,测试项目有Fire Strike、Fire Strike Extreme、Fire Strike Ultra(对应DX11,1080P、2K及4K分辨率)。Time Spy 和Time Spy Extreme(对应DX12 2K和4K分辨率)。还有Port Royal光线追踪性能。

  ▲七彩虹战斧GeForce RTX 4090豪华版显卡 Time Spy得分36384分。

  ▲七彩虹战斧GeForce RTX 4090豪华版显卡 Time Spy Extreme得分19292分。

  ▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike得分77359分。

  ▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike Extreme得分45734分。

  ▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike Ultra得分24866分。

  ▲七彩虹战斧GeForce RTX 4090豪华版显卡 Port Royal光追得分25669分。

  基准测试方面,战斧GeForce RTX 4090 豪华版对比RTX 3090 Ti,这性能提升幅度可以用“夸张”来形容。Time Spy性能提升68%;Time Spy Extreme性能提升73%;Fire Strike性能提升55%;Fire Strike Extreme性能提升76%;Fire Strike Ultra性能提升82%;而光追性能提升更是达到78%。怎么样?这新卡的性能提升幅度,各位看客老爷们还满意不?

  4K光栅化游戏性能测试:

  传统光栅化游戏测试分辨率为3840x2160,考虑显卡的定位,不测试2K及1080P分辨率。画质设定均为至高,关闭垂直同步功能,支持DLSS均处于关闭状态,全部测试的游戏由自带Benchmark输出结果。

  我们一共测试6款热门的3A大作,在4K分辨率,至高画质设定,不牺牲画质特效的前提下,也不需要DLSS辅助,战斧 GeForce RTX 4090 豪华版显卡均可以非常流畅运行。

  像渣优化的《赛博朋克2077》跑出76帧,而显卡杀手《荒野大镖客2》跑出121帧,《古墓丽影 暗影》更是跑出夸张的184帧,要知道这可是4K分辨率啊。毫无夸张地说,4K最高画质在战斧 GeForce RTX 4090 豪华版面前只能算是“入门”的挑战。

  对比GeForce RTX 3090 Ti,《赛博朋克2077》、《荒野大镖客2》、《极限竞速:地平线5》、《刺客信条 奥德赛》、《古墓丽影 暗影》、《孤岛惊魂5》分别提升46%、46%、73%、54%、73%、30%,提升幅度还是相当惊人的。

  DLSS 3 游戏实测:

  我们先来看看战斧 GeForce RTX 4090 豪华版在DLSS 3开启与关闭状态下,游戏画质变化如何?

  《瘟疫传说:安魂曲》DLSS 3 OFF VS DLSS 3 NO

  《逆水寒》DLSS 3 OFF VS DLSS 3 NO

  《Unity引擎》DLSS 3 OFF VS DLSS 3 NO

  我们截取部分支持DLSS 3游戏的实景画面,像《瘟疫传说:安魂曲》、《逆水寒》的游戏画面通过对比可以看到,在开启DLSS 3之后,画质并没有折损,反而是得到强化,尤其是光影效果更加真实。

  开启DLSS 3之后,游戏帧数的提升相当惊人,瘟疫传说:安魂曲》、《赛博朋克2077》的帧率分别翻了2.35倍、3.27倍。就算特别吃CPU资源的《微软模拟飞行》也翻了2.15倍。

  在画质没有损失反而加强的前提下,带来如此巨大的游戏性能提升,对于游戏玩家来说,无疑是幸福的存在。未来有DLSS 3加持下,4K+光追+最高特效,将会顺畅无比。

  DLSS 3游戏近期更新:

  ●《超级人类》(SUPER PEOPLE):抢先体验版将于10月12日13:00发布,支持DLSS 3

  ●《生死轮回》(Loopmancer)将于10月12日发布更新版,支持DLSS 3

  ●《逆水寒》“拂云庭“(Justice ‘Fuyun Court’): 全新图形展示将于10月13日发布,支持DLSS 3

  ●《微软模拟飞行》(Microsoft Flight Simulator):将于10月17日为Xbox Insider计划成员推出测试版,支持DLSS 3

  ●《瘟疫传说:安魂曲》(A Plague Tale: Requiem):将于10月18日发布,支持DLSS 3

  实时光线追踪游戏测试:

  RTX光线追踪测试,同为4K分辨率,画质设定均为至高,光追效果设定均为至高档位,不开启DLSS选项,接受至为苛刻的硬件考验。

  光追游戏测试部分,就算不开DLSS的情况下,除了《赛博朋克2077》,其他四款游戏,战斧 GeForce RTX 4090 豪华版已经可以超过60帧流畅运行。

  像光追效果十分明显的《Control》可以在140帧的超高帧率下,畅玩4K光追。《光明记忆:无限》、《古墓丽影 暗影》均突破100帧。战斧 GeForce RTX 4090 豪华版显卡真正带我们走进4K光追的时代。而对比GeForce RTX 3090 Ti,光追游戏性能提升幅度在70%左右。

  创作应用测试:

  由于测试时间关系,还有考虑到GeForce RTX 4090刚推出,专业创作应用软件需要去做优化,我们就只测了Blender这款热门的专业三维渲染软件,使用固定的Benchmark进行测试,测试了monster/junkshop/classroom三个场景。

  战斧 GeForce RTX 4090 豪华版在monster/junkshop/classroom场景得分为6331、2806、2911分,平均4050分。对比之下,领先GeForce RTX 3090 Ti 幅度达到80%以上,可见在创作领域,战斧 GeForceRTX 4090 豪华版也比GeForce RTX 3090Ti强出一截,帮助创作者节省大量的渲染时间。

  功耗与温度测试:

  在温度与功耗测试中,使用Furmark软件,对显卡进行10分钟的满载测试,用GPU-Z软件来监控显卡的温度与功耗表现。

  在满载10分钟之后,这时GPU的核心温度仅70℃,要知道这可是一张旗舰级显卡,性能怪兽。有这样的温度表现,绝对处于优秀的水平。

  功耗的话,平均接近450W,基本跟GeForce RTX 3090 Ti是持平的。不过,峰值功耗更猛一些。如果搭配新款旗舰CPU,比如i9-12900K、i9-13900K,建议至少1000W电源起步吧,850W压力还是挺大的。

  总结:

  经历了GeForce RTX 30系列显卡性能大跃进,很多人都担心GeForce RTX 40系列显卡无法超越前辈。当测完战斧 GeForce RTX 4090 豪华版后,我们担心显然是多余的。基于Ada Lovelace GPU架构设计AD102-300核心的RTX 4090再次实现性能飞跃,真正将游戏带入4K光追时代。曾几何时,4K游戏遥不可及,到如今的4K+光追最高特效流畅玩耍。或许摆在2-3年前,很多人想都不敢想吧。

  这次NVIDIA还带来DLSS 3,这是一项真正的黑技术。在开启DLSS 3之后,宛如打开性能释放的密钥,开启与关闭,性能提升非常非常显著,真正意义上实现从性能的堆砌到质的改变。未来会有越来越多的游戏加入DLSS 3,N卡玩家zui幸福的存在。

  战斧 GeForce RTX 4090 豪华版的450W功耗,虽说整体功耗不低,但发热控制得不错。并且这个功耗也是频率大幅度提升的结果,由此带来强大的性能提升,我认为是值得的。

  想了解或购买硬件产品请关注成都佳诚伟业科技

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。


   
 
上一篇:如何识别Windows server操作系统正版授权             下一篇: AMD推出第四代霄龙服务器处理器Genoa
成都市武侯区一环路南一段20号普利大厦B座904
028-85073711
028-85073711
2580954105@qq com
关注我们
 
关注我们
 
销售咨询

友情链接: 西南IT网 | 海信会议平板 | 成都服务器总代理 | 戴尔服务器 | 惠普H3C服务器 | 联想服务器 | 超聚变服务器 | 浪潮服务器 | 图形工作站 | 群晖NAS存储 |

成都佳诚伟业科技有限公司 版权所有     蜀ICP备17006923号
四川/云南/贵州/重庆/甘肃/青海/宁夏/新疆/西藏/成都市/绵阳市/自贡市/攀枝花市/泸州市/德阳市/广元市/遂宁市/内江市/乐山市/资阳市/宜宾市/南充市/达州市/雅安市/广安市/巴中市/眉山市