GeForce RTX 20系列


![]() RTX 2080Ti 创始版 | |
发布日期 | 2018年9月20日 2019年7月9日 (Super系列) |
---|---|
代号 | TU10x |
架构 | Turing |
产品系列 | GeForce RTX |
电晶体 |
|
制造工艺 | 台积电 12nm(FinFET) |
显示卡 | |
中端GPU | GeForce RTX 2050 GeForce RTX 2060 GeForce RTX 2060 Super |
高端GPU | GeForce RTX 2070 GeForce RTX 2070 Super GeFroce RTX 2080 GeForce RTX 2080 Super |
旗舰GPU | GeForce RTX 2080 Ti NVIDIA TITAN RTX |
API支持 | |
Direct3D | Direct3D 12 (12_2) |
OpenGL | OpenGL 4.6 |
OpenCL | OpenCL 1.2 |
Vulkan | Vulkan 1.2 |
历史 | |
前代产品 | GeForce 10系列 |
相关产品 | GeForce 16系列 |
后继产品 | GeForce 30系列 |
GeForce RTX 20系列是NVIDIA继GeForce GTX 10系列之后开发的图形处理器系列。该系列于2018年8月20日在Gamescom(科隆游戏展)上发布[1][2][3],首发产品是GeForce RTX 2080及2080Ti[4]。此系列产品被重新命名为RTX而非沿用已使用多年的GTX,以突显对光线跟踪的支持。
架构特性
[编辑]RTX 20系列基于图灵微架构(Turing),其主要特点是支持实时光线跟踪(Ray tracing)技术。[5]该系列显卡通过搭载RT(光线追踪运算)核心,显著加速了光线跟踪的计算过程。这些核心能够高效处理四叉树和球形层次结构,并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。RT核心的光线追踪功能在模拟反射、折射和阴影的操作上可以取代传统的使用立方体贴图或深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真,尤其是可以将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。
该系列显卡还搭载了张量运算核心(Tensor Core)。张量核心最初是为深度学习任务设计的,例如训练图像超分辨率模型。然而,消费级显卡中的张量核心主要用于进行已经训练完成的深度学习模型的推理。这些模型的训练和分析通常在高性能计算机上进行,后者负责确定并优化实现特定目标(如图像超分辨率)的方法。之后,消费级显卡上的张量核心会使用这些经过高性能计算机训练获得的模型,从而实现例如提高图像分辨率等功能,如深度学习超级采样(DLSS)[6]。
NVIDIA早在基于帕斯卡和伏打图形处理微架构的GeForce GTX TITAN系列上就已经在画面运算中应用了深度学习和光线追踪技术,但由于当时设备性能的限制,仅能生成静态画面,而GeForce RTX 20系列则首次在画面处理中大规模采用深度学习技术,并引入了与深度学习相结合的光线追踪实时动态画面技术。[7]
细节
[编辑]- GeForce RTX 20系列采用的台积电12nm FFN制程由伏特微架构使用的12nm FFC制程改进(但本质上依旧是台积电16nm FF+制程的延伸版本),性能是后者的1.1倍,功耗只有后者的70%,核心面积则可以缩小20%
- 为容纳数量庞大的运算单元,GeForce RTX 20系列的核心面积相比帕斯卡微架构大幅增加,由GP102(GeForce GTX 1080Ti)的471mm2增加至TU102(GeForce RTX 2080Ti)的754mm 2
- GeForce RTX 20系列支持 CUDA 计算能力 7.5
- GeForce RTX 20系列采用了全新的SM阵列设计: TPC包含了两个SM单元(Pascal为1个),SM单元重新分配为64个FP32、64个INT32、8个Tensor Core 、1个RT Core ,同时添加了独立的INT数据路径,支援FP32和INT32操作的并发执行。
- 为共享暂存、一级暂存、纹理暂存引入了统一架构,一级暂存与共享暂存大小是灵活可变的,可以根据需要在64+32KB或者32+64KB之间变换,让一级暂存更充分利用资源,也减少一级暂存延迟,并提供比Pascal GPU中使用的一级暂存更高的频宽,同时二级暂存容量提升。
- Tensor Core(张量核心) : 负责人工智慧、神经网路运算,增加了新的INT8和INT4精度模式,FP16半精度也能够被完整支援通常会用到矩阵融合乘加(FMA)运算,新的INT8精度模式的工作速率是此速率的两倍,张量核心为矩阵运算提供了显著的加速,除了新的神经图形功能外,还用于深度学习训练和推理操作。
- NGX (Neural Graphics Acceleration)框架: 利用张量核心,在游戏中实现深度学习功能,GeForce Experience会自动匹配Turing显卡并且下载可用的NGX Core软件包,对应如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
- DLSS (深度学习超级采样) : 利用张量核心实现在较低的实际分辨率下更快地渲染,。
- AI InPainting : 利用基于大量真实世界图像训练的模型,GeForce RTX 20系列可以补全图片中缺失的内容、移除照片的噪点、失真部分。
- AI Super Rez : GeForce RTX 20系列可以将原始图像的分辨率放大2倍、4倍、8倍,使图像更加锐利。
- AI Slow-Mo : GeForce RTX 20系列可以对常见的30fps的影片进行智慧补帧计算,获得240/480fps的慢动作影片,而不需要专门的高帧率摄影机。
- RT Core : 一条专门为光线追踪计算设计的渲染流水线,用于加速计算边界体积层次(BVH)遍历以及光线和三角求交(光线投射)。
- 支持GDDR6显示记忆体
- 附有影像串流压缩技术(Display Stream Compression,DSC)1.2版的DisplayPort 1.4a
- 功能集PureVideo的硬体加速视讯解码
- NVLink连接器(与伏打微架构的不相容)
- VirtualLink VR
- GPU Boost 4[8]
设计
[编辑]在RTX的光线追踪示范程序中使用了微软的DXR 、NVIDIA的OptiX 以及Vulkan等API来实现光线追踪功能[9]。
芯片规格
[编辑]型号 | 推出日期 | 核心 代号 |
制程 (nm) |
晶体管数 & 晶粒面积 |
核心配置 | 时脉频率 | 填充率 | 显示记忆体 | 运算性能 (TFLOPS) | 每秒 光线数 (十亿) |
汇流排 介面 |
TDP (W) |
NVLink 支援 |
发售价格(美金) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
核心组态 SPs:TMUs:ROPs[a] |
光追 核心 |
张量 核心 |
二级 暂存 (MB) |
预设 (MHz) |
加速 (MHz) |
记忆体 (MT/s) |
像素 (GP/s) |
材质 (GT/s) |
容量 (GB) |
频宽 (GB/s) |
类型 | 介面 频宽 (位元) |
单精度 (加速) |
双精度 (加速) |
半精度 (加速) |
张量 浮点 |
零售版 | 创始版 | |||||||||
GeForce RTX 2060 |
2019年 1月15日 |
TU106- 200A- KA-A1 |
12 | 108亿 445mm2 |
1920:120:48 (30 SM) |
30 | 240 | 3 | 1365 | 1680 | 14000 | 65.52 | 163.8 | 6 | 336 | GDDR6 | 192 | 5.24 (6.45) |
0.16 (0.20) |
10.5 (12.9) |
51.6 | 5 | PCIe 3.0 x16 |
160 | 否 | $349 | |
GeForce RTX 2060 TU104 |
2020年 1月10日 |
TU104- 150-KC- A1 |
136亿 545mm2 |
$300 | |||||||||||||||||||||||
GeForce RTX 2060 Super |
2019年 7月9日 |
TU106- 410- A1 |
108亿 445mm2 |
2176:136:64 (34 SM) |
34 | 272 | 4 | 1470 | 1650 | 90.5 | 191.4 | 8 | 448 | 256 | 6.12 (7.18) |
0.19 (0.22) |
12.2 (14.4) |
57.4 | 6 | 175 | $399 | ||||||
GeForce RTX 2070 |
2018年 10月17日 |
TU106- 400-A1 |
2304:144:64 (36 SM) |
36 | 288 | 1410 | 1620 | 90.24 | 203.04 | 6.50 (7.47) |
0.20 (0.23) |
12.3 (14.9) |
59.7 | $499 | 不适用 | ||||||||||||
TU106- 400A-A1 |
1620+ | $499+ | $599 | ||||||||||||||||||||||||
GeForce RTX 2070 Super |
2019年 7月9日 |
TU104- 410-A1 |
136亿 545mm2 |
2560:160:64 (40 SM) |
40 | 320 | 1605 | 1770 | 102.72 | 256.8 | 8.22 (9.06) |
0.26 (0.28) |
16.4 (18.1) |
72.5 | 7 | 215 | 2路 NVLink |
$499 | |||||||||
GeForce RTX 2080 |
2018年 9月20日 |
TU104- 400-A1 |
2944:184:64 (46 SM) |
46 | 368 | 1515 | 1710 | 96.96 | 278.76 | 8.92 (10.1) |
0.28 (0.32) |
17.8 (20.1) |
80.5 | 8 | $699 | 不适用 | |||||||||||
TU104- 400A-A1 |
1710+ | $699+ | $799 | ||||||||||||||||||||||||
GeForce RTX 2080 Super |
2019年 7月23日 |
TU104- 450-A1 |
3072:192:64 (48 SM) |
48 | 384 | 1650 | 1815 | 15500 | 105.6 | 316.8 | 496 | 10.1 (11.2) |
0.32 (0.35) |
20.3 (22.3) |
89.2 | 250 | $699 | ||||||||||
GeForce RTX 2080 Ti |
2018年 9月27日 |
TU102- 300-K1- A1 |
186亿 754mm2 |
4352:272:88 (68 SM) |
68 | 544 | 5.5 | 1350 | 1545 | 14000 | 118.8 | 367.2 | 11 | 616 | 352 | 11.8 (13.4) |
0.37 (0.42) |
23.5 (26.9) |
107.6 | 10 | $999 | 不适用 | |||||
TU102- 300A-K1- A1 |
1545+ | $999+ | $1,199 | ||||||||||||||||||||||||
NVIDIA Titan RTX |
2018年 12月18日 |
TU102- 400-A1 |
4608:288:96 (72 SM) |
72 | 576 | 6 | 1770 | 129.6 | 388.8 | 24 | 672 | 384 | 12.4 (16.3) |
0.39 (0.51) |
24.9 (32.6) |
130.5 | 11 | 280 | $2,499 |
另见
[编辑]- 图灵微架构
- NVIDIA GeForce 10系列
- NVIDIA GeForce 16系列
- NVIDIA GeForce 30系列
- NVIDIA GeForce 40系列
- Nvidia Quadro
- Nvidia Tesla
参见
[编辑]- ^ GeForce RTX 2080 launch live blog: Nvidia's Gamescom press conference as it happens. TechRadar. [2018-08-21]. (原始内容存档于2018-08-20) (英语).
- ^ Nvidia’s new RTX 2080, 2080 Ti video cards ship on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始内容存档于2018-08-20) (美国英语).
- ^ Nvidia unveils powerful new RTX 2070, RTX 2080, RTX 2080 Ti graphics cards. Polygon. [2018-08-20]. (原始内容存档于2018-08-20).
- ^ Nvidia’s new RTX 2080, 2080 Ti video cards shipped on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始内容存档于2018-08-20) (美国英语).
- ^ Nvidia announces RTX 2000 GPU series with ‘6 times more performance’ and ray-tracing. The Verge. [2018-08-20]. (原始内容存档于2018-08-20).
- ^ GeForce RTX 2080 即可享受 4K HDR 60FPS 遊戲效能,DLSS 反鋸齒效能再增加 1 倍. techbang.com. 2018-08-24 [2018-10-08]. (原始内容存档于2018-10-09) (中文(台湾)).
- ^ 新增 RT 與 Tensor ,NVIDIA GeForce RTX 2080/2080Ti Turing 架構、Founders Edition、效能表現一次看懂. techbang.com. 2018-09-19 [2018-10-08]. (原始内容存档于2018-10-09) (中文(台湾)).
- ^ The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. [2018-10-08]. (原始内容存档于2018-09-15).
- ^ NVIDIA RTX™ platform. Nvidia. [2018-08-21]. (原始内容存档于2018-08-24).
扩展链接
[编辑]- 官方网站
- Nvidia Nsight(页面存档备份,存于互联网档案馆)
- Nvidia Turing GPU Architecture: Graphics Reinvented (PDF). Nvidia. Nvidia Corporation. [2018-10-25]. (原始内容存档 (PDF)于2018-09-24) (英语).