世博app官方入口(全站)官方网站登录入口-世博app官方入口(全站)官方网站登录入口RDNA 4 GPU 的光栅化性能普及了近 2 倍-世博app官方入口(全站)官方网站登录入口

世博app官方入口(全站)官方网站登录入口RDNA 4 GPU 的光栅化性能普及了近 2 倍-世博app官方入口(全站)官方网站登录入口

发布日期:2025-08-11 06:42  点击次数:168

世博app官方入口(全站)官方网站登录入口RDNA 4 GPU 的光栅化性能普及了近 2 倍-世博app官方入口(全站)官方网站登录入口

(原标题:AMD RDNA 4 架构,深度解析)

若是您但愿不错相同碰面,迎接标星保藏哦~

起原:本色编译自wccftech,谢谢。

AMD 终于公布了其下一代 RDNA 4 GPU 架构的完好架构细节,该架构是专为 Radeon RX 9000 系列构建的。

自上一代RDNA 3 过甚升级版 RDNA 3.5推出以来,AMD 的 RDNA 4 架构一直备受期待。固然 RDNA 4 架构不会有任何超等发热友 SKU,但它如实带来了全新的变化,应该会普及游戏性能,因为它主要为游戏玩家策画。

因此,AMD 对 RDNA 4 带来了以下新变化:

针对高端游戏使命负载进行了高度优化

提高光栅化和筹备效用

后光跟踪性能的要紧校正

全面的高性能 ML 支撑

增强扫数使命负载的带宽效用

为游戏玩家和创作家提供多媒体校正

与 RDNA 2 比较,RDNA 4 GPU 的光栅化性能普及了近 2 倍,后光跟踪性能普及了近 2.5 倍,每个筹备单位的 ML(FP16 密集矩阵)使命负载普及了 3.5 倍。接下来,咱们将久了照看 RDNA 4 架构框图的构建块,望望通盘芯片是如何组合在一齐的。

RDNA 4 的新中枢 IP

RDNA 4 GPU 架构的中枢构建块是筹备引擎。

新的筹备单位配备双 SIMD32 矢量单位和增强矩阵运算,其中包括:

2x-16b 和 4x-8b/4b 密集矩阵速率

4:2 结构化疏淡性,兑现 +2 倍速率

新的 8b 浮点数据类型

带转置的矩阵负载

RDNA 4 还带来了新的着色校正,RDNA 4 着色不错动态分派寄存器。它们不错在需要时从池中恳求寄存器。它们不错在完成这项使命后将寄存器开释回池中,况兼软件会在分派恭候时代时治理条目。这不错更好地处理内存蔓延,同期分享中枢的合座效用不错权贵提高。

在标量单位方面,您不错得回新的 Float32 操作,同期休养更新包括拆分和定名樊篱、加快溢出/填充操作和校正的提示预取。

然后咱们有第三代后光跟踪单位,提供双倍的后光交叉率、校正的 BVH 压缩、加快的后光遍历和着色以及定向畛域框。这些新的后光跟踪中枢提供了芯片上最大的性能普及之一。每个后光加快器也得到了校正:

2x 盒子和三角形交叉单位

硬件实例逶迤

校正 RT 堆栈治理

BVH8 和校正的节点压缩

定向畛域框

这些新的后光跟踪升级还大大裁汰了 BVH 的内存要求。平均而言,成绩于 8 宽策画,RDNA 4 可将内存要求裁汰至 RDNA 3 的 60% 以下。

但这并不是全部。AMD 还推行了一种新的贬责决策,通过对每个框进行旋转编码来更细巧地绑定所包含的几何图形,从而裁汰遍通书钱,同期将框与几何图形对都不错匡助摒除大部分空间,况兼射线标的在插足框时会进行逶迤以匹配编码的旋转。这不错减少遍通书领,通过摒除遍历热门来裁汰峰值本钱,并将遍历性能提高 10%。

这些变化的驱逐是,与 RDNA 3 比较,RDNA 4 CU 在琢磨的时钟速率和带宽下提供了 2 倍的后光遍历性能。

还有一个校正的敕令处理器,它具有增强的数据包加快器。缓存也得到了升级,当今愈加均衡,具有高达 64 MB 的第三代 Infinity Cache、8 MB 的 L2 缓存和 2MB 的团聚 CU 缓存。在内存方面,RDNA 4 GPU 架构保留了对 GDDR6 的支撑,但已升级到更快的速率,最高可达 20.00 Gbps,容量高达 16 GB,并配有 256 位总线接口。RDNA 4 还遴荐了增强的内存压缩技巧来收缩可用带宽的压力。

关于 AI,AMD 正在应用其第三代矩阵加快引擎,该引擎具有校正的张量密集率、新的 8b 浮点数据类型、结构化疏淡性支撑和基于 ML 的升级或超辞别率。

与 RDNA 3 比较,RDNA 4 CU 在 FP16 的轨范场景中将图像生成性能提高了 2 倍(SDXL 1.5)。

媒体引擎遴荐双宽度策画,配备更新的编码/解码引擎,AVC、H.264、H.265 质地普及高达 25%,AV1 蒙胧量翻倍,并针对低蔓延流媒体进行了优化。临了,还有更新的 Radiance 裸露引擎,它当今支撑 DisplayPort 2.1a、HDMI 2.1b 输出和更新的缩放和锐化引擎。

RDNA 4 框图(顶部 Navi 48 芯片)

接下来,咱们转到代表完好 Navi 48 GPU SKU 的 RDNA 4 框图。RDNA 4 GPU 遴荐台积电 4nm 工艺节点制造,具有多达 539 亿个晶体管,SKU 尺寸为 356.5mm2。该芯片还完全稳妥 PCIe Gen5 轨范。

当今是时候拒绝 RDNA 4 芯片了。Navi 48 GPU(Radeon RX 9070 XT)由四个着色器引擎构成,每个引擎都包含多个“双筹备单位”,而不是 WGP。每个双筹备单位都有两个筹备单位,每个着色器引擎统统有 8 个 DCU 或 16 个 CU。芯片本人统统有 32 个 DCU 或 64 个 CU,统统有 4096 个流处理器或着色器单位。

每个 DCU 都有两个后光加快器引擎,每个着色器引擎统统有 16 个 RA,统统有 64 个 RA,而每个 DCU 还包含 4 个矩阵加快引擎,每个着色器引擎统统有 32 个 MA,统统有 128 个 MA。每个着色器引擎还包含四个 RB+ 块、一个光栅化器引擎和一个 Prim Unit 块。芯片外围有四个第三代无穷缓存部分和四个 4x16 位内存限度器。

L2 缓存位于 GPU 的正中间,其中还包括两个 Geometry 处理器、两个 ACE 单位以及 HWS 和 DMA 各一个。该芯片使用 Infinity Fabric 聚会。

AMD 的翌日之路

在 PC 游戏范围,后光跟踪庸碌被视为落伍的术语。天然,它是一种跟踪后光的体式,不错使场景看起来更传神,况兼刚刚驱动在游戏机范围得回温煦,但竞争敌手相同使用另一种类型的后光跟踪器,称为旅途跟踪。固然后光跟踪使用单个主后光在光源上投射反射、暗影和折射,但旅途跟踪使用扫数可能的后光旅途,况兼是一种更勤劳的技巧。

NVIDIA 的旅途跟踪技巧在《赛博一又克 2077》或《心灵杀手 II》等游戏中可见一斑,这些游戏被视为对图形要求最高的游戏之一,而且画面成果也统统令东说念主咋舌。通过升级和帧生成等新技巧,旅途跟踪得以兑现,但 Green 团队还投资了一项名为“后光重建”的全新技巧,该技巧通过移除引擎内的降噪器并使用 AI/ML 匡助从头评估和重建图像,匡助更灵验地兑现旅途跟踪。

看起来 AMD 也遴荐了这种顺序,并遴荐我方的神经超等采样和去噪技巧来兑现 RDNA 4 的旅途跟踪功能。

升级的媒体和裸露功能

若是不评述媒体和裸露引擎,咱们就不可驱逐此次久了探讨。因此,领先,咱们领先先容新的媒体引擎,它通过以下形态提供增强的游戏流媒体和录制功能:

H.264 低蔓延编码质地普及 25%

HEVC 编码质地普及 11%

B 帧提高了 AV1 编码效用

720p 编码性能普及高达 30%

针对 FFMPEG、OBS 和 Handbrake 进行了优化

VCN 低功耗视频播放(AV1 和 VP9 性能普及 50%)

裸露体验也得到了改善,增强的 FreeSync 电源优化模式可在大多半双裸露器建立中提供更低的闲散功率,硬件翻转部队支撑可将视频帧休养卸载到 GPU 并从简 CPU 功率以进行视频播放,而 Radeon 图像锐化 2 可提供高质地的图像和场景,并通过单个切换在扫数 API 上使命。

https://wccftech.com/amd-rdna-4-architecture-deep-dive-new-compute-units-raytracing-cores-ai-enhancements-path-tracing/

半导体杰作公众号保举

专注半导体范围更多原创本色

温煦宇宙半导体产业动向与趋势

*免责声明:本文由作家原创。著作本色系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或支撑,若是有任何异议,迎接联系半导体行业不雅察。

今天是《半导体行业不雅察》为您分享的第4050期本色,迎接温煦。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

可爱咱们的本色就点“在看”分享给小伙伴哦



相关资讯
热点资讯
  • 友情链接:

Powered by 世博app官方入口(全站)官方网站登录入口 @2013-2022 RSS地图 HTML地图