欢迎来到亿配芯城! | 免费注册
RTX 4070 SUPER首发评测
发布日期:2024-01-18 07:16     点击次数:68

一、前言:性价比爆棚的GeForce RTX 40 SUPER系列显卡

新一代的Ada Lovelace架构带来了令人咋舌的能效比,RTX 40系列显卡在性能相同的情况下,功耗只有上代一半甚至更低,只是价格并不是那么亲民。

2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型号。

其中RTX 4070 SUPER以4899元的售价提供了接近于RTX 4070 Ti的性能;

而RTX 4070 Ti SUPER售价与RTX 4070 Ti同为6499元,但性能与9499元的RTX 4080相差无几;

至于RTX 4080 SUPER,它在规格大幅度提升的情况下,将售价降到了8099元,比起RTX 4080足足便宜了1400元。

新一代RTX 40系列SUPER GPU的到来,瞬间让NVIDIA显卡性价比爆棚!

ea1e9cbc-b485-11ee-8b88-92fbcf53809c.png 完整的AD104核心

RTX 4070 SUPER使用了与RTX 4070(Ti)相同的AD104核心。

完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代Tensor Core张量核心、60个第三代RT Core光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。

ea339d74-b485-11ee-8b88-92fbcf53809c.png AD104-350核心(RTX 4070 SUPER)

RTX 4070 SUPER做了部分精简,依然是5组GPC,只是将其中2组中的6个TPC减到了5个,也就是5组GPC、28个TPC、7168个流处理器、228个Tensor Core、56个RT Core、80个ROP单元、36MB二级缓存。

除了二级缓存之外,其他规格削减不到7%,而显存规格维持不变,可以想象,它的性能会非常接近RTX 4070 Ti。

RTX 4070 SUPER的详细规格参数如下:

ea467066-b485-11ee-8b88-92fbcf53809c.jpg

二、图赏:与RTX 4070长一样 6+3相供电电路

ea5cd90a-b485-11ee-8b88-92fbcf53809c.jpg

包装盒和RTX 4070公版差不多,区别在于原来是白字,现在改成了黑色字体。

ea73f4be-b485-11ee-8b88-92fbcf53809c.jpg

开箱。

ea827818-b485-11ee-8b88-92fbcf53809c.jpg

附赠一条2x8Pin转16Pin的电源线。

ea95b4dc-b485-11ee-8b88-92fbcf53809c.jpg

上面是RTX 4070 SUPER,下面是RTX 4070,长相也几乎一模一样,差别在于4070的金属条是银灰色,4070 SUPER是深黑色,而且还能反光。

eaaad5e2-b485-11ee-8b88-92fbcf53809c.jpg

背面。

eabeaa9a-b485-11ee-8b88-92fbcf53809c.jpg

依然是16Pin供电接口,不过功耗很低,完全不用担心烧化接口的情况。

ead1b27a-b485-11ee-8b88-92fbcf53809c.jpg

3个DP1.4和1个HDMI 2.1接口。

eae767dc-b485-11ee-8b88-92fbcf53809c.jpg

没有用均热板,和RTX 4070一样,都是铜底+热管的散热设计。

eafdc6da-b485-11ee-8b88-92fbcf53809c.jpg

依旧是RTX 4070的PCB版,非常mini,改造成ITX版型也不难。

6+3相供电电路设计,虽然简单,但也足够应付220W的TGP。

eb108888-b485-11ee-8b88-92fbcf53809c.jpg

这是RTX 4070的PCB板,对比一下,二者区别在于RTX 4070多一个空焊位,也就是少一相供电。

eb28c52e-b485-11ee-8b88-92fbcf53809c.jpg

PCB板背面。

eb438db4-b485-11ee-8b88-92fbcf53809c.jpg

RTX 4070 SUPER采用的是AD104-350核心,芯片面积295mm2,拥有358亿晶体管。

GPU旁边是6颗美光GDDR6X显存,单颗2GB,总容量12GB,等效频率21GHz,带宽504GB/s。

三、理论性能测试:3DMark运行频率可达2805MHz

测试平台如下:

eb5aa2ec-b485-11ee-8b88-92fbcf53809c.jpg

1、3DMark Fire Strike

eb6fc30c-b485-11ee-8b88-92fbcf53809c.jpg

在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4070 SUPER图形分数达到了24185分,核心温度最高68℃,热点温度最高85℃,核心运行最高频率为2805MHz,最高风扇转速1397PM,整卡最高功耗222W。

eb89b884-b485-11ee-8b88-92fbcf53809c.jpg

在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4070 SUPER图形分数达到了12112分,核心温度最高69℃,核心运行最高频率为2805MHz,最高风扇转速1397RPM,最高功耗222W。

eba2795a-b485-11ee-8b88-92fbcf53809c.jpg

2、3DMark Time Spy

ebb41d5e-b485-11ee-8b88-92fbcf53809c.jpg

在2K分辨率3DMark Time Spy测试中,RTX 4070 SUPER图形分数达到了20649分,核心温度最高753℃,核心运行最高频率为2790Hz,最高风扇转速2028RPM,最高功耗223W。

ebc76b3e-b485-11ee-8b88-92fbcf53809c.jpg

在4K分辨率3DMark Time Spy Extreme测试中,RTX 4070 SUPER图形分数达到了9948分,核心温度最高74℃,核心运行最高频率为2790Hz,最高风扇转速13990RPM,最高功耗224W。

ebd734ec-b485-11ee-8b88-92fbcf53809c.jpg

四、1080P游戏性能测试:与RTX 3090 Ti旗鼓相当

1、刺客信条:英灵殿

ebe6ca1a-b485-11ee-8b88-92fbcf53809c.jpg

ebf880a2-b485-11ee-8b88-92fbcf53809c.jpg

2、地平线:零之曙光

ec0cb5f4-b485-11ee-8b88-92fbcf53809c.jpg

ec1c6e90-b485-11ee-8b88-92fbcf53809c.jpg

3、孤岛惊魂5

ec310f76-b485-11ee-8b88-92fbcf53809c.jpg

ec41c73a-b485-11ee-8b88-92fbcf53809c.jpg

4、孤岛惊魂6

ec54ddb6-b485-11ee-8b88-92fbcf53809c.jpg

ec689f40-b485-11ee-8b88-92fbcf53809c.jpg

5、古墓丽影:暗影

ec799264-b485-11ee-8b88-92fbcf53809c.jpg

ec8bf8b4-b485-11ee-8b88-92fbcf53809c.jpg

6、霍格沃茨之遗

ecbad5a8-b485-11ee-8b88-92fbcf53809c.jpg

7、极限竞速:地平线5

ecd2129a-b485-11ee-8b88-92fbcf53809c.jpg

ece50206-b485-11ee-8b88-92fbcf53809c.jpg

8、赛博朋克2077

ecff78d4-b485-11ee-8b88-92fbcf53809c.jpg

ed101c20-b485-11ee-8b88-92fbcf53809c.jpg

9、巫师3

ed429f06-b485-11ee-8b88-92fbcf53809c.jpg

10、无主之地3

ed56a5e6-b485-11ee-8b88-92fbcf53809c.jpg

ed66f90a-b485-11ee-8b88-92fbcf53809c.jpg

11、星空

ed736406-b485-11ee-8b88-92fbcf53809c.jpg

ed84a2ca-b485-11ee-8b88-92fbcf53809c.jpg

12、战争机器5

eda0c32e-b485-11ee-8b88-92fbcf53809c.jpg

edb00c8a-b485-11ee-8b88-92fbcf53809c.jpg

测试结果汇总如下:

edcaa266-b485-11ee-8b88-92fbcf53809c.jpg

在1080P分辨率下,RTX 4070 SUPER的性能与RTX 3090 Ti不相上下,差距仅有1%。比起RTX 4070强了13%,和RTX 4070 Ti相比就差了3%。

六、2K性能测试:强于RTX 3080 Ti

1、刺客信条:英灵殿

edef2226-b485-11ee-8b88-92fbcf53809c.jpg

ee0007d0-b485-11ee-8b88-92fbcf53809c.jpg

2、地平线:零之曙光

ee110562-b485-11ee-8b88-92fbcf53809c.jpg

ee2c8bca-b485-11ee-8b88-92fbcf53809c.jpg

3、孤岛惊魂5

ee411af4-b485-11ee-8b88-92fbcf53809c.jpg

ee54089e-b485-11ee-8b88-92fbcf53809c.jpg

4、孤岛惊魂6

ee676736-b485-11ee-8b88-92fbcf53809c.jpg

ee81962e-b485-11ee-8b88-92fbcf53809c.jpg

5、古墓丽影:暗影

ee951bb8-b485-11ee-8b88-92fbcf53809c.jpg

eebe4ea2-b485-11ee-8b88-92fbcf53809c.jpg

6、霍格沃茨之遗

eef9c068-b485-11ee-8b88-92fbcf53809c.jpg

7、极限竞速:地平线5

ef153280-b485-11ee-8b88-92fbcf53809c.jpg

ef3570b8-b485-11ee-8b88-92fbcf53809c.jpg

8、赛博朋克2077

ef469c58-b485-11ee-8b88-92fbcf53809c.jpg

ef5d56d2-b485-11ee-8b88-92fbcf53809c.jpg

9、巫师3

ef897abe-b485-11ee-8b88-92fbcf53809c.jpg

10、无主之地3

ef98b7d6-b485-11ee-8b88-92fbcf53809c.jpg

efabfe7c-b485-11ee-8b88-92fbcf53809c.jpg

11、星空

efd0dcba-b485-11ee-8b88-92fbcf53809c.jpg

12、战争机器5

efe7d4c4-b485-11ee-8b88-92fbcf53809c.jpg

effbb66a-b485-11ee-8b88-92fbcf53809c.jpg

测试数据汇总如下:

f0076118-b485-11ee-8b88-92fbcf53809c.jpg

2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti强2%,与RTX 4070相比,也有14%的优势,但是比RTX 4070 Ti则有5%的差距。

此外我们还测试了4K分辨率下的成绩,汇总如下:

f01bfeca-b485-11ee-8b88-92fbcf53809c.jpg

由于192Bit显存位宽的关系,RTX 4070 SUPER在4K分辨率下的性能会明年不如RTX 3080 Ti,但大多数游戏依旧能保持60FPS以上的帧率。

我们测试的12款3A大作,有3款帧率低于60FPS,但这几款游戏都支持DLSS 3,开启之后帧率会有翻倍提升。

六、Stable Diffusion体验:TensorRT加持 生图速度提升350%

2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能让具备Tensor单元的GeForce显卡在Stable Diffusion Web UI中获得翻倍的性能。

本次我们将对比SDXL加速方法与PyTorch xFormers(常规加速方法)的性能差异。

f02bd4e4-b485-11ee-8b88-92fbcf53809c.jpg

我们生成10张太空大战图像,分辨率1024*1024,使用PyTorch xFormers加速时,耗时9分17秒。

f051bc9a-b485-11ee-8b88-92fbcf53809c.jpg

使用SDXL加速之后,耗时仅为2分02秒,性能提升350%。

f06899ba-b485-11ee-8b88-92fbcf53809c.jpg

从终端中也可以看到,RTX 4070 SUPER使用默认加速器时,生图速度只有1.1it/s,而在TensorRT加持下, 电子元器件采购网 生图速度猛然提升到了4.50it/s。

七、DLSS 3游戏测试之一:3款DLSS 3游戏

此次我们一共测试了6款游戏,包括3款支持DLSS 3的游戏:《3DMark》、《毁灭全人类》、《燕云十六声》。

另外还有3款同时支持DLSS与光追的游戏:《光明记忆》:《生死轮回》、《赛博朋克2077》。

所有DLSS 3以及光追测试都是在2K分辨率下进行。

1、DLSS3 测试--燕云十六声

《燕云十六声》是一款开放世界中国风武侠动作游戏,画质精良,号称国产3A破阵制作。目前这款游戏还处于内测阶段。

f08151b2-b485-11ee-8b88-92fbcf53809c.png

这款游戏于日前推送了对于DLSS 3支持的更新,下面我们来看看RTX 4070 SUPER SUPER的表现,测试分辨率为2560*1440,画质选项为“超高”。

默认超高画质下,游戏帧率为91FPS。

开启DLSS 2(性能模式)之后,帧率达到了146FPS,提升了60%。

打开DLSS 3(插帧)之后,帧率来到了198FPS,相比默认画质帧率提升了117%。

f155b8a8-b485-11ee-8b88-92fbcf53809c.png

2、3DMark

f175267a-b485-11ee-8b88-92fbcf53809c.jpg

DLSS 2模式下帧率为140FPS,比默认的65FPS提升了133%。

f186df78-b485-11ee-8b88-92fbcf53809c.jpg

DLSS 3的成绩为150FPS,相比默认提升了150%。

f19d364c-b485-11ee-8b88-92fbcf53809c.png

3、毁灭全人类2:重新探测

最高画质下,RTX 4070 Ti的帧率为131FPS。

开启DLSS 3之后,帧率来到了242FPS,近乎翻倍。

f1e166fa-b485-11ee-8b88-92fbcf53809c.jpg

八、DLSS 3游戏测试之二:3款支持DLSS 3的光追游戏

1、光明记忆:无限

开启RTX时,游戏的帧率为109FPS。

开启DLSS 3之后,帧率提升到了235FPS,提升了116%。

f226a9ae-b485-11ee-8b88-92fbcf53809c.jpg

2、生死轮回

开启光追之后,游戏的帧率仅有65FPS。

打开DLSS 3之后,帧率提升到了195FPS,提升幅度为195%。

f26f5fbe-b485-11ee-8b88-92fbcf53809c.jpg

3、赛博朋克2077

开启光追时,帧率为40FPS。

这是DLSS 3的画面,与原生画面的差距难以分辨,但是帧率提升到了155FPS。

f2ad47a2-b485-11ee-8b88-92fbcf53809c.jpg

f2c22ece-b485-11ee-8b88-92fbcf53809c.jpg

九、功耗测试:2K游戏平均功耗仅为3080 Ti的62%

f2e4abb6-b485-11ee-8b88-92fbcf53809c.jpg

将Furmark的参数设定为1920*1200分辨率、0AA。

运行13分钟之后,RTX 4070 SUPER的温度稳定在74度附近,功耗稳定在220W,烤机时GPU频率为1620MHz,CPU风扇转速只有2153RPM。

2)、真实游戏功耗测试

1、GTA V

这是1080P分辨率。RTX 4070 SUPER功耗126W,温度53度。

f318b7bc-b485-11ee-8b88-92fbcf53809c.jpg

2K分辨率下,RTX 4070 SUPER功耗164W。

2、绝地求生

f33a5624-b485-11ee-8b88-92fbcf53809c.jpg

1080P分辨率下,RTX 4070 SUPER功耗203W,温度689度,运行频率2760MHz。

f34e737a-b485-11ee-8b88-92fbcf53809c.jpg

2K分辨率下,RTX 4070 SUPER0功耗212W。

3、古墓丽影:暗影

f35e2c2a-b485-11ee-8b88-92fbcf53809c.jpg

1080P分辨率下,RTX 4070 SUPER的功耗为207W。

f36f6e40-b485-11ee-8b88-92fbcf53809c.jpg

2K分辨率下,RTX 4070 SUPER功耗是212W,运行频率2745MHz,温度64度。

测试数据汇总如下:

f38c7f8a-b485-11ee-8b88-92fbcf53809c.jpg

在1080P分辨率下,RTX 4070 SUPER在3A游戏中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,仅相当于RTX 3080 Ti的62%。

十、总结:堪称业界良心

本次测试小结如下:

1、AI性能

即使没有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion画图首选,而今在TensorRT加持下,RTX 4070 SUPER的生图速度在原有基础上提升了350%,这样的表现相信是不会再有任何竞争对手了。

2、1080P游戏性能

f3a0033e-b485-11ee-8b88-92fbcf53809c.png

我们所测的12款游戏,除了《星空》之外 ,剩余11款游戏RTX 4070 SUPER的帧率全部都超过了160FPS,就连显卡杀手《赛博朋克2077》也有169FPS。

就性能而言,1080P分辨率下,RTX 4070 SUPER几乎能与RTX 3090 Ti并驾齐驱,相比RTX 3080 Ti强了6%,比RTX 4070则强了13%,和4070 Ti的差距只有3%。

3、2K游戏性能

f3bdc8a6-b485-11ee-8b88-92fbcf53809c.png

2K分辨率下,同样是除了《星空》之外,RTX 4070 SUPER在其他11款游戏中都能保持120FPS以上的帧率。

在2K分辨率下,RTX 4070 SUPER依旧能比RTX 3080 Ti强2%,不过和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070则强了15%左右。

另外,我们也测试了4K,RTX 4070 SUPER在此分辨率下帧率会有较大损失,不过在绝大部分游戏中依旧能够跑出60FPS以上的帧率。

少数几款显卡杀手游戏虽然帧率只有50PFS左右,但好在这些游戏都支持DLSS 3,开启之后帧率甚至能突破100FPS。

4、功耗

f38c7f8a-b485-11ee-8b88-92fbcf53809c.jpg

我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。

2K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗是207W,RTX 3080 Ti则是332W。

4K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗为214W,RTX 3080 Ti则已经跑到了350W的TGP上限。

5、DLSS 3和光追

目前能玩的DLSS 3游戏多达数十款,我们测试了6款。

在开启DLSS 2之后,游戏帧率平均提升幅度为107%。打开DLSS 3,游戏帧率平均提升幅度达到了159%。

如今的NVIDIA GPU早已不是单纯的游戏显卡,特别是在AI应用方面,有了SDXL,能将Stable Diffusion生图速度提升4倍左右,让原本已经大幅度领先对手的N卡彻底无敌。

至于价格,4899元就能买到一块1080P性能堪比RTX 3090 Ti、2K性能强于RTX 3080 Ti的显卡,同时游戏功耗仅有200W左右,堪称业界良心。

RTX 4070 SUPER只是开始,接下来的RTX 4070 Ti SUPER和RTX 4080 SUPER将会带来更多的惊喜。

NVIDIAGeForceRTX40SIUPER系列现已上市,请到京东DIYSUPER超能年货节上选购GeForceRTX4070SUPER/4080SUPER公版和合作伙伴显卡。

审核编辑:刘清



相关资讯