j9九游会真人AMD 正在愚弄其第三代矩阵加快引擎-九游娱乐(中国)有限公司-官方网站

新闻Position

你的位置：九游娱乐(中国)有限公司-官方网站 > 新闻 > j9九游会真人AMD 正在愚弄其第三代矩阵加快引擎-九游娱乐(中国)有限公司-官方网站

发布日期：2025-03-13 11:08 点击次数：170

j9九游会真人AMD 正在愚弄其第三代矩阵加快引擎-九游娱乐(中国)有限公司-官方网站

（原标题：AMD RDNA 4 架构j9九游会真人，深度通晓）

若是您但愿不错经常碰头，迎接标星储藏哦~

开端：本质编译自wccftech，谢谢。

AMD 终于公布了其下一代 RDNA 4 GPU 架构的齐备架构细节，该架构是专为 Radeon RX 9000 系列构建的。

自上一代RDNA 3 偏激升级版 RDNA 3.5推出以来，AMD 的 RDNA 4 架构一直备受期待。天然 RDNA 4 架构不会有任何超等发热友 SKU，但它如实带来了全新的变化，应该会升迁游戏性能，因为它主要为游戏玩家筹办。

因此，AMD 对 RDNA 4 带来了以下新变化：

针对高端游戏使命负载进行了高度优化

提高光栅化和计算服从

爽快跟踪性能的要紧调动

全面的高性能 ML 守旧

增强扫数使命负载的带宽服从

为游戏玩家和创作家提供多媒体调动

与 RDNA 2 比拟，RDNA 4 GPU 的光栅化性能升迁了近 2 倍，爽快跟踪性能升迁了近 2.5 倍，每个计算单位的 ML（FP16 密集矩阵）使命负载升迁了 3.5 倍。接下来，咱们将潜入斟酌 RDNA 4 架构框图的构建块，望望整个芯片是若何组合在通盘的。

RDNA 4 的新中枢 IP

RDNA 4 GPU 架构的中枢构建块是计算引擎。

新的计算单位配备双 SIMD32 矢量单位和增强矩阵运算，其中包括：

2x-16b 和 4x-8b/4b 密集矩阵速率

4:2 结构化稀疏性，终了 +2 倍速率

新的 8b 浮点数据类型

带转置的矩阵负载

RDNA 4 还带来了新的着色调动，RDNA 4 着色不错动态分拨寄存器。它们不错在需要时从池中苦求寄存器。它们不错在完成这项使命后将寄存器开释回池中，何况软件会在分拨恭候时辰时照顾条款。这不错更好地处理内存蔓延，同期分享中枢的举座服从不错显耀提高。

在标量单位方面，您不错赢得新的 Float32 操作，同期调遣更新包括拆分和定名障蔽、加快溢出/填充操作和调动的辅导预取。

然后咱们有第三代爽快跟踪单位，提供双倍的爽快交叉率、调动的 BVH 压缩、加快的爽快遍历和着色以及定向畛域框。这些新的爽快跟踪中枢提供了芯片上最大的性能升迁之一。每个爽快加快器也得到了调动：

2x 盒子和三角形交叉单位

硬件实例挪动

调动 RT 堆栈照顾

BVH8 和调动的节点压缩

定向畛域框

这些新的爽快跟踪升级还大大镌汰了 BVH 的内存要求。平均而言，收货于 8 宽筹办，RDNA 4 可将内存要求镌汰至 RDNA 3 的 60% 以下。

但这并不是全部。AMD 还推行了一种新的处分决策，通过对每个框进行旋转编码来更清雅地绑定所包含的几何图形，从而镌汰遍黄历钱，同期将框与几何图形对皆不错匡助摒除大部分空间，何况射线标的在参预框时会进行挪动以匹配编码的旋转。这不错减少遍历法子，通过摒除遍历热门来镌汰峰值本钱，并将遍历性能提高 10%。

这些变化的终结是，与 RDNA 3 比拟，RDNA 4 CU 在换取的时钟速率和带宽下提供了 2 倍的爽快遍历性能。

还有一个调动的号令处理器，它具有增强的数据包加快器。缓存也得到了升级，刻下愈加均衡，具有高达 64 MB 的第三代 Infinity Cache、8 MB 的 L2 缓存和 2MB 的团聚 CU 缓存。在内存方面，RDNA 4 GPU 架构保留了对 GDDR6 的守旧，但已升级到更快的速率，最高可达 20.00 Gbps，容量高达 16 GB，并配有 256 位总线接口。RDNA 4 还剿袭了增强的内存压缩技能来收缩可用带宽的压力。

关于 AI，AMD 正在愚弄其第三代矩阵加快引擎，该引擎具有调动的张量密集率、新的 8b 浮点数据类型、结构化稀疏性守旧和基于 ML 的升级或超分辩率。

与 RDNA 3 比拟，RDNA 4 CU 在 FP16 的圭臬场景中将图像生成性能提高了 2 倍（SDXL 1.5）。

媒体引擎剿袭双宽度筹办，配备更新的编码/解码引擎，AVC、H.264、H.265 质料升迁高达 25%，AV1 否认量翻倍，并针对低蔓延流媒体进行了优化。临了，还有更新的 Radiance 袒露引擎，它刻下守旧 DisplayPort 2.1a、HDMI 2.1b 输出和更新的缩放和锐化引擎。

RDNA 4 框图（顶部 Navi 48 芯片）

接下来，咱们转到代表齐备 Navi 48 GPU SKU 的 RDNA 4 框图。RDNA 4 GPU 剿袭台积电 4nm 工艺节点制造，具有多达 539 亿个晶体管，SKU 尺寸为 356.5mm2。该芯片还完全稳妥 PCIe Gen5 圭臬。

刻下是时候隔断 RDNA 4 芯片了。Navi 48 GPU（Radeon RX 9070 XT）由四个着色器引擎构成，每个引擎都包含多个“双计算单位”，而不是 WGP。每个双计算单位都有两个计算单位，每个着色器引擎悉数有 8 个 DCU 或 16 个 CU。芯片自己悉数有 32 个 DCU 或 64 个 CU，悉数有 4096 个流处理器或着色器单位。

每个 DCU 都有两个爽快加快器引擎，每个着色器引擎悉数有 16 个 RA，悉数有 64 个 RA，而每个 DCU 还包含 4 个矩阵加快引擎，每个着色器引擎悉数有 32 个 MA，悉数有 128 个 MA。每个着色器引擎还包含四个 RB+ 块、一个光栅化器引擎和一个 Prim Unit 块。芯片外围有四个第三代无尽缓存部分和四个 4x16 位内存限度器。

L2 缓存位于 GPU 的正中间，其中还包括两个 Geometry 处理器、两个 ACE 单位以及 HWS 和 DMA 各一个。该芯片使用 Infinity Fabric 开通。

AMD 的将来之路

在 PC 游戏限制，爽快跟踪世俗被视为落后的术语。天然，它是一种跟踪爽快的体式，不错使场景看起来更传神，何况刚刚运转在游戏机限制赢得关怀，但竞争敌手时常使用另一种类型的爽快跟踪器，称为旅途跟踪。天然爽快跟踪使用单个主爽快在光源上投射反射、暗影和折射，但旅途跟踪使用扫数可能的爽快旅途，何况是一种更斯文的技能。

NVIDIA 的旅途跟踪技能在《赛博一又克 2077》或《心灵杀手 II》等游戏中可见一斑，这些游戏被视为对图形要求最高的游戏之一，而且画面终结也统统令东说念主咋舌。通过升级和帧生成等新技能，旅途跟踪得以终了，但 Green 团队还投资了一项名为“爽快重建”的全新技能，该技能通过移除引擎内的降噪器并使用 AI/ML 匡助重新评估和重建图像，匡助更有用地终了旅途跟踪。

看起来 AMD 也剿袭了这种设施，并剿袭我方的神经超等采样和去噪技能来终了 RDNA 4 的旅途跟踪功能。

升级的媒体和袒露功能

若是不评论媒体和袒露引擎，咱们就不成终局此次潜入探讨。因此，当先，咱们当先先容新的媒体引擎，它通过以下式样提供增强的游戏流媒体和录制功能：

H.264 低蔓延编码质料升迁 25%

HEVC 编码质料升迁 11%

B 帧提高了 AV1 编码服从

720p 编码性能升迁高达 30%

针对 FFMPEG、OBS 和 Handbrake 进行了优化

VCN 低功耗视频播放（AV1 和 VP9 性能升迁 50%）

袒露体验也得到了改善，增强的 FreeSync 电源优化边幅可在大大都双袒露器成立中提供更低的适意功率，硬件翻转队伍守旧可将视频帧调遣卸载到 GPU 并省俭 CPU 功率以进行视频播放，而 Radeon 图像锐化 2 可提供高质料的图像和场景，并通过单个切换在扫数 API 上使命。

https://wccftech.com/amd-rdna-4-architecture-deep-dive-new-compute-units-raytracing-cores-ai-enhancements-path-tracing/

半导体宏构公众号推选

专注半导体限制更多原创本质

关怀大师半导体产业动向与趋势

*免责声明：本文由作家原创。著作本质系作家个东说念主不雅点，半导体行业不雅察转载仅为了传达一种不同的不雅点，不代表半导体行业不雅察对该不雅点赞同或守旧，若是有任何异议，迎接斟酌半导体行业不雅察。

今天是《半导体行业不雅察》为您分享的第4050期本质，迎接关怀。

『半导体第一垂直媒体』

及时专科原创深度

公众号ID：icbank

心爱咱们的本质就点“在看”分享给小伙伴哦

上一篇：九游会J9性能是后者的 10 倍以上-九游娱乐(中国)有限公司-官方网站

下一篇：j9九游会由于个东说念主电脑和智高手机买家的库存水平高-九游娱乐(中国)有限公司-官方网站