本地时间9月20日晚间,英伟达 (NVIDIA)在GTC 2022大会上的GeForce Beyond环节,正式发布了RTX 40系列显卡。英伟达此次发布了三款GeForce RTX 40系列显卡,别离是GeForce RTX 4090以及GeForce RTX 4080的12GB和16GB版本。
(图自:英伟达,下同)
全新Ada架构
据英伟达CEO黄仁勋介绍,40系显示芯片将接纳全新的Ada架构,那个名字也是为了致敬19世纪英国数学家埃达·洛夫莱斯(Ada Lovelace),她是出名英国诗人拜伦之女,成立了轮回和子法式概念,也被认为是地球上最早的计算机法式员。
那款芯片最多能够包罗760亿个晶体管和超越16384个CUDA核心,较上一代Ampere架构多70%。那得益于台积电的4N工艺和美光科技的GDDR6X显存,理论能效较上一代Ampere 8nm工艺进步一倍,意味着有更高的超频潜力。
新一代Ada架构
做为此次发布的RTX 40系列显卡核心,Ada Lovelace 核心将此中的SM多单位处置器、RT Core(光逃核心)以及Tensor Core(可理解为AI核心)都停止了换代晋级,此中的RT Core(光逃核心)拥有两倍的光线与三角形求交性能,而且通过全新的引擎来削减了开销,Tensor Core则是提拔了性能。
三款显卡的特征
黄仁勋强调,新一代RTX 4090旗舰显卡搭载了全球最快的游戏GPU,在完好的光线逃踪游戏中,与上一代接纳DLSS 2的RTX 3090 Ti比拟,接纳DLSS 3的RTX 4090的性能提拔可达4倍。
在现代游戏中,RTX 4090的性能提拔高达2倍,同时连结了不异的450W功耗。RTX 4090具有760亿个晶体管、16384个CUDA核心和24 GB高速美光GDDR6X显存,在4K分辩率的游戏中持续以超越100 FPS运行。
RTX 4080则有两个版本,16GB版拥有9728个CUDA核心和16 GB高速美光GDDR6X显存,在现代游戏中的性能可达GeForce RTX 3080 Ti的2倍;即便在较低功率下,性能也比GeForce RTX 3090 Ti更强大。12GB版则拥有7680个CUDA核心和12GB 美光 GDDR6X显存,其性能也比RTX 3090 Ti强。
有阐发认为,12GB版的规格更像是RTX 4070 Ti级别或者70级此外规格,但是此次被老黄拉到了80级别。
每款显卡更多的详细参数规格目前尚未更多的信息流出,如RT核心数量、Tensor Core数量等信息,按照已知信息,汇总的RTX 40系列显卡部门关键参数如下供各人参考。
RTX 4090利用AD102-300核心,台积电4nm工艺,显存拥有384bit显存位宽,显存带宽为1008GB/s。其核心频次基准频次为2230MHz,BOOST频次为2520MHz,设想TGP为450W;
RTX 3080 16GB利用AD103-300核心,台积电4nm工艺,显存拥有256bit显存位宽,显存带宽为720GB/s。其核心频次基准频次为2210MHz,BOOST频次为2505MHz,设想TGP为350W;
RTX 3080 12GB利用AD103-400核心,台积电4nm工艺,显存拥有192bit显存位宽,显存带宽为504GB/s。其核心频次基准频次为2310MHz,BOOST频次为2610MHz,设想TGP为285W。光逃性能再晋级
Ada Lovelace 核心性能提拔的一大关键是来自于SM多单位处置器方面的晋级,英伟达全新引入了Shader Execution Reordering那一项着色器施行重排序手艺,通俗的话说起来就是让GPU的处置过程也有了类似于CPU处置过程中的乱序处置才能,能够有效的提拔性能,可获得2-3倍的光线逃踪性能提拔。
英伟达还着重介绍了依托新架构的DLSS 3手艺。DLSS 3.0手艺包罗四项组件,而在此中最为关键的是新参加的AI帧生成器。而那一个手艺比拟较于DLSS 2.0此前接纳AI在高帧率帧和低帧率帧中停止读取重衬着的过程而生成中间帧的过程有所区别,DLSS 3.0是操纵深度进修的AI在像素级帧到帧标的目的的运动、速度信息根底长进行预测并通过一系列的处置在不影响原有游戏处置管线的情况下停止中间帧的生成,大幅度进步了游戏的帧数表示。那一个DLSS 3.0手艺在英伟达的演示中,表示十分超卓,也是此次发布的三张RTX 40系列显卡原有极大性能提拔的一个关键。
简单来说,过去两代DLSS手艺均通过AI算法进步衬着速度,而最新的DLSS 3已经前进到能够衬着插帧,并操纵光流场手艺,在无需GPU或CPU运算的就能进步衬着速度。
全新架构还搭载了Opacity Micromap引擎,将光线逃踪的Alpha-Test集合性能提拔2倍。全新的Micro-Mesh引擎则可以在不带来更多的BVH构建和存储资本消耗的前提下提拔图形的丰硕度。
最初,全新Tensor Core新增了Hooper FP8 Transformer Engine能够供给1.4 petaFLOPS张量处置性能。
为了展示新手艺的效果,英伟达也在现场展现了对性能要求极高/优化蹩脚著称的《赛博朋克2077》实机测试,在光逃效果全开到更大的布景下,DLSS 3可以将画面帧数从20多帧进步至近百帧。黄仁勋暗示,在《赛博朋克2077》如许的现代游戏上,显卡为了计算光的角度,对每个像素都要停止600余次计算,较2018年初次引入实光阴逃时进步了16倍。
据悉,华硕、七彩虹、耕升、影驰、技嘉、映寡、微星和索泰等也即将推出GeForce RTX 4090和4080 GPU标频版和超频版。NVIDIA也将限量推出RTX 4090和RTX 4080(16GB)FE版。同时,GeForce RTX 40系列GPU还会通过宏碁,外星人,华硕,戴尔,惠普,联想和微星等OEM的产物出卖。
价格也晋级
在性能获得庞大晋级的同时,那一代英伟达游戏显卡的价格也再立异高。
RTX 4090将于10月12日正式出售,价格为1599美圆(12999元人民币),比拟上一代RTX 3090 11999元的其售价涨价1000元。
RTX 40系列显卡售价
RTX 4080 12GB内存版本起售价为899美圆(人民币7199元),而16 GB版本的起售价为1199美圆(人民币9499元),两款4080显卡将在11月上市。值得一提的是,2020年RTX 3080系列发布时的官方起售价为699美圆(人民币5499元),本次40系列的价格间接上了一个层次。