win7之家 11 月 4 日消息,预热大半年之后,AMD 终于揭开了它 RDNA 3 架构的面纱,随着比上一代便宜的 Radeon RX 7900 XTX(999 美元)和 Radeon RX 7900 XT 显卡(899 美元)的到来,A 卡似乎再次拥有了与 N 卡争一争的机会。
首先,大多数细节与我们此前爆料过的 AMD RDNA 3 架构和 RX 7000 系列预期内存一致。RDNA 3 将使用台积电 5nm 芯片,内含一个主 GCD (图形计算模块) 以及 6 个 MCD (内存缓存模块)。
此外,RDNA 3 在架构上也有着很多底层的改进,例如更多的计算单元和更多的 GPU 着色器。
从 AMD 给出的资料来看,这一代显卡继续专注于功率和能效方面,据称 RDNA 3 的每瓦性能相比 RDNA 2 可提高 50%。这一点与抬高功耗压榨性能的英伟达 RTX 4090 有点不一样。外媒认为 AMD 应该是觉得没有必要在默认情况下将耗电量提到那种高度。
让我们先来快速浏览一下核心规格,并将其规格与上一代 RDNA 2 和英伟达 RTX 4090 横向进行一下对比。
win7之家了解到,AMD RX 7900 XTX 没有学英伟达,还是传统 8Pin 接口,功耗 355W 只需两个 8Pin,而 RX 7900 XT 300W 同样是 2 个 8Pin。
AMD 有两个版本的 Navi 31 GPU,其中更高规格的型号命名为 RX 7900 XTX ,这张卡启用了完整的 GCD 和 6 个 MCD,而 RX 7900 XT 则只启用了 96 个计算单元中的 84 个以及 5 个 MCD。
从技术上讲, RX 7900 XT 第六个 MCD 可能只是物理屏蔽掉了,但不管怎样它都没办法自行启用,而且这张卡本身也没有额外的 4GB GDDR6 显存给它用,所以开核什么的就别想了。
与竞争对手相比,RX 7900 XTX 在算力方面仍落后于 RTX 4090,毕竟英伟达还有 Tensor 加持,可实现更强的 AI 处理能力。
外媒认为,考虑到 RX 6950 XT 在 1080p 和 1440p 上已经几乎赶上 RTX 3090 Ti(4K 则落后 5% 左右),但它理论上却少了 40% 的原始计算性能。因此,纸面上 RX 7900 XTX 比 RTX 4090 少 32% 的计算量可能无法代表什么。
至于另一款,RX 7900 XT 应该不是用来对标 RTX 4090 的,我们只需要考虑它将如何与 RTX 4080 竞争就够了。
从参数方面来看,它有着更多的显存和更高的带宽,再加上 16% 的计算能力优势。因此,即使 RDNA 3 着色器的性能有所下降 (后续介绍),AMD 这一代卡看起来也应该非常有竞争力,至少纸面上可以与英伟达次旗舰碰一碰,何况它还低了 200 美元。
在过去两代的 RDNA 架构上,AMD 已多次强调其能效方面的优势,而 RDNA 3 则延续了这一重点。
AMD 声称,与 RDNA 2 相比,新一代 GPU 每瓦性能提高了 54%,而 RDNA 2 的 PPW 比 RDNA 提高了 54%。在过去的三代中,AMD 的效率几乎可以说是指数型上升。
我们以上一代 RX 6900 XT 为例,它的性能基本上是上一代 RX 5700 XT 的两倍(1440p 超分辨率),而外媒实测功耗大约在 308W,而 5700 XT 则为 214W,所以效率应该是提高了 38%。
那么面对 RTX 40 系列的进逼,AMD 该如何继续提高效率?这可能在很大程度上都要归功于台积电 N7 到 N5 (7nm 到 5nm) 的迭代演变,但架构上的更新肯定也有那么一些帮助。
新一代 RDNA 3 统一了计算单元,各个都有 64 个双发流处理器 (GPU 着色器)。,相当于 RDNA 2 的两倍,而且 AMD 可以向每个 SIMD 单元发送不同的工作负载,又或者它可以让两者在同一类型的指令上协同工作,进而提高效率。
值得注意的是,最新的 AMD、Intel 和 Nvidia GPU 现在全都是 128 着色器设计 ——AMD 的计算单元 (CU),Nvidia 的流媒体多处理器 (SM),Intel 的 Xe 矢量引擎 (XVE)。
不单单是 CU 中 GPU 着色器数量翻倍,AMD 的 CU 总数也从 80 增加到 96 个。相比之下,AMD 的 Navi 31 的着色器数量可达 Navi 21 的 2.4 倍,而功耗只增加了 18%。
此外,AMD 还提高了它的 AI 加速器的性能,而之前该公司很少谈论这一被英伟达碾压的领域。我们无法确定新款算力如何,但 AMD 称其 AI 加速器支持 INT8 和 BF16 (脑浮点 16 位) 操作。因此,它们可能至少拥有部分类似于 Nvidia 的 Tensor 核心,但支持的指令集总数并不相同。
但不管怎么说,AMD 表示其新的 AI 加速器相比上一代提供了 2.7 倍的改进 —— 两倍的数量,更多的处理器,以及略高的吞吐量。
最后,AMD 表示他们已经优化了光线追踪加速器,RDNA 3 版本可带来 1.5 倍的光线追踪性能,还拥有新的专用指令和改进的 BVH (光追 / 盒) 排序和遍历,这个词具体指什么还没完全搞清楚,但我们肯定新卡在光线跟踪和改进的光栅化性能上有一个巨大的飞跃,至于相比 4090 如何还需要等后续评测。
除了计算单元,RDNA 3 还对许多其他领域进行了大升级,例如 AMD Radiance 显示引擎,或基本的视频输出支持。
此外,AMD 还升级了 RDNA 3,支持 DisplayPort 2.1 (英伟达 (*^_^*)),这也意味着 AMD 从此成为第二家支持 DP2.x 的 GPU 公司(英特尔 Arc 是首款)。
不过英特尔仅支持每通道 10 Gbps 或总共 40 Gbps 的带宽,而 DP2.1 实际上可支持单通道 20 Gbps 或总共 80 Gbps 的带宽。
不过目前来看 AMD 也不支持 20 Gbps,而是选择了 13.5 Gbps 这一中间级别,因此 AMD 新一代 GPU 可实现 54Gbps 的总带宽,这基本上是 DP1.4a 的两倍。
得益于 DSC (显示流压缩) 技术,AMD 可以在 4K 分辨率上支持高达 480Hz 的刷新率,或在使用其 DisplayPort 2.1 接口的 8K 显示器上支持高达 165Hz 的刷新率。值得一提的是,预计首批 DisplayPort 2.1 显示器和电视将在 2023 年初上市,名单见图。
AMD 还通过 RDNA 3 大幅改进了媒体引擎。这一点已经或多或少地得到了曝光,但 Navi 31 惊喜的地方在于拥有双媒体引擎,完全能够支持两个同时运行的 8K60 流 —— 可以是编码、解码,也可以并联 / 组合起来以提高编码单个流媒体的性能。
视频引擎的另一个更新之处在于对 AV1 的支持,这意味着所有三家 GPU 厂商从此都已经对 AV1 提供完整的硬件编码 / 解码支持。,希望我们后续能看到更多的软件解决方案和流媒体服务支持 AV1 而不是 H.264。
此外,视频引擎的频率比以前更高 (我们不确定高多少),AMD 还指出它有 AI 增强的视频编码能力,不过具体的也同样需要等后续硬件评测时再去做一些视频编码测试,敬请期待。
与此同时,AMD 也给出了一些 Radeon RX 7900 XTX 的初始性能数据,例如使命召唤、赛博朋克 2077、看门狗、生化危机 8 等等,相对于上一代 RX 6950 XT 大约有 50% 到 70% 的提升。
我们不能保证上述性能声明的准确性,但 AMD 选择这些游戏肯定是有原因的。
还有,AMD 又一次介绍了其 FidelityFX 超级分辨率 (FSR) 技术。这是老生常谈的内容了,我们直接略过。
据介绍,AMD 目前已拥有超过 216 款游戏和应用支持 FSR,但大多数都是 FSR 1.X,毕竟它是开源的,所以很容易集成,而且已经有一年多的时间了,给开发者准备的时间也更长,而 FSR 2.0 则年轻得多,在今年 5 月才发布,目前只在少数游戏中才能看到。
展望未来,AMD 的 FSR 将继续“充满吸引力”。我们当然也希望 FSR2 的普及率能够超过 FSR1.x,毕竟它能够为用户带来更好的体验,不管是什么平台,而且游戏也能够同时支持这两种技术,可能在部分场景中 (如低端显卡和集成显卡上) FSR1 对某些用户更适合。
据称,FSR3 技术将在明年的某个时候发布,它将寻求某种形式的补帧或插帧,有点类似于英伟达的 DLSS 3 所做的方向。AMD 没有透露太多细节,部分原因可能是 FSR3 还没有完全想好后续怎么做,但在早期测试中它可以将部分游戏的帧数提高两倍。
网友评论