技嘉GeForce RTX 4070 GAMING OC 12**品参数
核心架构:Ada Lovelace
核心代号:AD104
制程工艺:TSMC 4N定制
SM单元:46
CUDA核心数(流处理器):5888
光追核心数(RT Cores):46
AI核心数(Tensor Cores):184
核心频率:1920MHz~2565MHz
显存容量:12GB GDDR6X
显存速率:21Gbps
显存位宽:192bit
显存带宽:504GB/s
支持DLSS版本:DLSS 3
TGP:200W
建议搭配电源额定功率:700W
产品尺寸:300mm×130mm×57.6mm
首发参考价格:5199元
老生常谈:Ada架构的那些事儿
有关于Ada Lovelace的新特性与新功能,我们在每一次的NVIDIA GeForce RTX 40系列产品解析前,都会反复赘述。当然,除了有凑字数的嫌疑,确实也有帮助大家加深记忆,抑或是方便新读者们了解它的变化以及该架构为新系列显卡带来前卫提升的目的。当然,如果读者朋友们对Ada Lovelace架构以及它的新特性、新功能已经了然于胸,可自行跳过这部分的文字解析,直接来到技嘉RTX 4070魔鹰OC的体验、测试环节。
缓存暴增
Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。
更强的SM
AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。
第三代光追核心
第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。
Shader Execution Reordering着色器执行重排序
着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
DLSS 3与OFA光流加速器
新一代NVIDIA编码器(NVENC)
RTX 40系高端GPU实现了双第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。不过对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。
更强的Studio性能
同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。
●Modder可以重制经典游戏,并通过RTX Remix开启RTX。
▲RTX 4070魔鹰OC的顶部处的背光Logo除了可以点缀外观、提升颜值,还能彰显其身份
▲接口方面,RTX 4070魔鹰OC配备了3DP 1.4a 1DMI 2.1的组合
▲RTX 4070魔鹰OC的散热器内部配备了直触式铜底并搭配8根复合式热管。
▲PCB板上采用8 3相供电
▲技嘉RTX 4070魔鹰OC搭载了拥有5888个CUDA核心的AD104-250-A1核心。
▲该显卡配备了6颗容量为2GB的美光GDDR6X显存
核心方面,搭载了基于Ada Lovelace架构的AD104核心,其拥有46个光追核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。其默认频率为1920MHz,bosst频率为2565MHz,较公版RTX 4070多出90MHz,纸面实力更强。同时,AD104核心周围围绕着6颗容量为2GB的美光GDDR6X显存,且其参数与RTX 4070 Ti保持一致,显存位宽为192bit,总带宽为504GB/s。就内部散热与用料来看,超规格的技嘉RTX 4070魔鹰OC应该在后续测试中拥有更出彩的发挥。按照NVIDIA的设想,RTX 4070是一颗能满足100fps 的全特效光追游戏应用的GPU,技嘉RTX 4070魔鹰OC能否胜任呢?
▲技嘉RTX 4070魔鹰OC经过了出厂预超频处理,其Boost频率达到了2565MHz,高出官方指导Boost频率2475MHz一小截。
测试平台
GPU:技嘉RTX 4070魔鹰OC、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部分测试)
CPU:英特尔酷睿i9-13900K
主板:AORUS Z790 MASTER
内存:AORUS DDR5 6000 32GB
电源:鑫谷昆仑冰山1250W(ATX 3.0)
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 Pro 22H2
显卡驱动:NVIDIA Game Ready Driver 531.42
从3DMark结果来看,技嘉RTX 4070魔鹰OC的实际成绩颇为亮眼——相比RTX 3070时,它平均有32%以上的性能提升,由于Ada Lovelace架构升级到了第三代RT Cores,在测试光追性能的Port Royal上,技嘉RTX 4070魔鹰OC相比RTX 3070的性能增幅达到了40%左右。而对比RTX 3070 Ti,在3DMark测试中,技嘉RTX 4070魔鹰OC依然保证了胜利姿态,整体性能相比RTX 3070 Ti领先24%左右。不过相对于RTX 4070 Ti,技嘉RTX 4070魔鹰OC综合成绩平均落后约22%,这也是二者的综合硬件规格差距导致的。
Ada Lovelace架构对Studio创作应用方面的优化使得NVIDIA GeForce RTX 40系显卡拥有更为出色的生产力,特别是对于那些经常花费时间进行画面渲染的用户而言,有了NVIDIA GeForce RTX 40系显卡,自然也是事半功倍,可节省不少时间。我们在这个环节采用了Davinci resolve 18、Blender Opendata、Blender 3.5、V-Ray benchmark等多款软件对技嘉RTX 4070魔鹰OC进行了深入测试,而该显卡在Studio创作应用的表现也确实没有让我们失望,在Blender Opendata的Monster、Junkshop、classroom三项测试中,技嘉RTX 4070魔鹰OC分别得到了3105、1542、1550分,而RTX 3070分别得到了1787、1107、963分,RTX 3070 Ti分别得到了1953、1202、1003分。在V-ray benchmark的GPU RTX模式与GPU CUDA模式的测试中,技嘉RTX 4070魔鹰OC分别得到了2611、1876分,而RTX 3070分别得到了1778、1419分,RTX 3070 Ti分别得到了1949、1497分。不仅如此,在应对视频转码、图像处理方面,技嘉RTX 4070魔鹰OC的综合表现同样稳压RTX 3070 Ti、RTX 3070,整体性能表现领先前一代对位产品30%以上,赢得了实至名归的全面胜利。
RTX VSR,清晰播放视频娱乐
除了应对游戏、创作之外,NVIDIA还在近期的驱动中为用户们带来了一个小惊喜——RTX Video Super Resolution功能(简称RTX VSR),它能够减少视频纹理损失、锐化边缘和丰富细节,从而提升画面清晰度。通过NIVIDA控制面板开启该功能之后,用户可以在支持RTX VSR功能的浏览器或播放器(目前支持VSR技术的浏览器主要是最新版的Chrome和Edge)中得以享受更清晰的视频娱乐。当然要使用RTX VSR功能,用户们还必须拥有RTX 30系以上的GPU,并得到最新驱动程序的支持。根据实际播放的视频画面来看,RTX VSR将作用于整个画面,特别是在细节处,能够起到降噪的作用,让原本糊成一团的细节得以呈现出更分明的轮廓,从而让用户感受到细节满满的视频画面。
通过加入散热测试,我们能够在探究显卡性能之余,更好地了解它们的稳定性以及最大能耗比,因此这个环节同样重要。从实际的功耗测试来看,技嘉RTX 4070魔鹰OC在实际应用中的功耗表现较前代产品确实有了很大的改善。在主要考察光追游戏性能的3DMark Port Royal测试中,技嘉RTX 4070魔鹰OC的功耗释放平均约为215W。而旨在考察DX12传统游戏的TimeSpy Extreme测试中,技嘉RTX 4070魔鹰OC的功耗释放平均约为205W,其能耗比均比RTX 3070 Ti、RTX 3070得到显著提升。而在几个游戏的实际运行功耗测试中,技嘉RTX 4070魔鹰OC的平均游戏功耗约为187W左右,在能耗比的优势上远远超过了RTX 3070 Ti和RTX 3070。
此外,我们还对技嘉RTX 4070魔鹰OC进行了实际的烤机测试,以考察其散热性能。在室温25℃的情况下,经过半小时Furmark烤机之后,技嘉RTX 4070魔鹰OC最终温度控制在61℃,在日渐炎热的当下,它的核心温度仍旧比较“清凉”,由此可见三风扇散热系统的过人之处。
▲最终,我们将技嘉RTX 4070魔鹰OC的核心bosst频率稳定至2750MHz。
▲经过超频后的技嘉RTX 4070魔鹰OC成功完成了3DMark Time spy Extreme的测试,并得到9250的显卡得分。
在散热测试完成之后,我们进一步通过技嘉智能管家(GCC)对技嘉RTX 4070魔鹰OC进行手动超频——即便是这款显卡已经经过了预超频处理,在多次尝试之后,我们仍旧将它的核心bosst频率稳定至2750MHz,较超频前多出了185MHz。同时,在这样的状态下,技嘉RTX 4070魔鹰OC成功完成3DMark Time spy Extreme的测试,且得到了9250的显卡得分,较超频之前的8805分多出了5%,对于动手能力强的玩家而言,这款显卡可玩性不错。另外,有鉴于它的功耗较公版产品高出些许,因此大家在选择电源时,最好搭配额定功率为700W的高品质电源。
小结
略有遗憾的是,NVIDIA从RTX 4070 Ti到RTX 4070,老黄的“这一刀”略微有点“下手狠”,纸面规格差距大也导致RTX 4070在性能上相比RTX 4070 Ti要逊色不少。或许这是NVIDIA吸取了上一代RTX 3070 Ti与RTX 3070之间价位差与性能差不匹配,导致二者都非常尴尬的经验而做出的调整吧。不过从价格上来看,RTX 4070的首发价格相比RTX 4070 Ti,倒也基本符合规格与性能的差距,玩家们就各取所需吧。
整体测试结果来看,技嘉RTX 4070魔鹰OC还是很好地担负起了1440p@100fps光追游戏畅玩的重任,在所有参与测试游戏的体验中,技嘉RTX 4070魔鹰OC在开启DLSS之后,基本都实现了100 fps的1440p全特效光追游戏畅玩目的。在Ada Lovelace以及它的新特性、新功能的帮助下,技嘉RTX 4070魔鹰OC在面对上代显卡产品时完全形成了碾压的态势,其性能提升非常显著,特别是在借助DLSS 3之后,哪怕对手是RTX 3070 Ti,综合帧率提升也能达到75%以上。即使在传统游戏性能上,技嘉RTX 4070魔鹰OC的性能也领先RTX 3070 Ti和RTX 3070达到了20%、30%以上。
另外需要强调的时,在能耗比方面,技嘉RTX 4070魔鹰OC也有非常显著的优化,能够爆发出更强劲的实力。不只是游戏场景,Studio创作应用以及AI制图方面,技嘉RTX 4070魔鹰OC都同样有着上代产品难以比肩的优势,完全做到了“既要还要”的多重目标。当然,就显卡本身而言,科幻的外观加之多样的背光部位还是令其具备不错的辨识度,硬派的风格也能俘获不少玩家的芳心。特别是内部豪华的用料以及表现仍旧给力的风之力散热系统,这使得技嘉RTX 4070魔鹰OC显卡成为了一位非常全面的“六边形战士”,对于大多数装机预算在万元左右的游戏玩家来说,它是一款值得你拥有的全能产品。