新闻Position

你的位置:九游娱乐(中国)有限公司-官方网站 > 新闻 > j9九游会真人AMD 正在愚弄其第三代矩阵加快引擎-九游娱乐(中国)有限公司-官方网站

j9九游会真人AMD 正在愚弄其第三代矩阵加快引擎-九游娱乐(中国)有限公司-官方网站

发布日期:2025-03-13 11:08    点击次数:170

j9九游会真人AMD 正在愚弄其第三代矩阵加快引擎-九游娱乐(中国)有限公司-官方网站

(原标题:AMD RDNA 4 架构j9九游会真人,深度通晓)

若是您但愿不错经常碰头,迎接标星储藏哦~

开端:本质编译自wccftech,谢谢。

AMD 终于公布了其下一代 RDNA 4 GPU 架构的齐备架构细节,该架构是专为 Radeon RX 9000 系列构建的。

自上一代RDNA 3 偏激升级版 RDNA 3.5推出以来,AMD 的 RDNA 4 架构一直备受期待。天然 RDNA 4 架构不会有任何超等发热友 SKU,但它如实带来了全新的变化,应该会升迁游戏性能,因为它主要为游戏玩家筹办。

因此,AMD 对 RDNA 4 带来了以下新变化:

针对高端游戏使命负载进行了高度优化

提高光栅化和计算服从

爽快跟踪性能的要紧调动

全面的高性能 ML 守旧

增强扫数使命负载的带宽服从

为游戏玩家和创作家提供多媒体调动

与 RDNA 2 比拟,RDNA 4 GPU 的光栅化性能升迁了近 2 倍,爽快跟踪性能升迁了近 2.5 倍,每个计算单位的 ML(FP16 密集矩阵)使命负载升迁了 3.5 倍。接下来,咱们将潜入斟酌 RDNA 4 架构框图的构建块,望望整个芯片是若何组合在通盘的。

RDNA 4 的新中枢 IP

RDNA 4 GPU 架构的中枢构建块是计算引擎。

新的计算单位配备双 SIMD32 矢量单位和增强矩阵运算,其中包括:

2x-16b 和 4x-8b/4b 密集矩阵速率

4:2 结构化稀疏性,终了 +2 倍速率

新的 8b 浮点数据类型

带转置的矩阵负载

RDNA 4 还带来了新的着色调动,RDNA 4 着色不错动态分拨寄存器。它们不错在需要时从池中苦求寄存器。它们不错在完成这项使命后将寄存器开释回池中,何况软件会在分拨恭候时辰时照顾条款。这不错更好地处理内存蔓延,同期分享中枢的举座服从不错显耀提高。

在标量单位方面,您不错赢得新的 Float32 操作,同期调遣更新包括拆分和定名障蔽、加快溢出/填充操作和调动的辅导预取。

然后咱们有第三代爽快跟踪单位,提供双倍的爽快交叉率、调动的 BVH 压缩、加快的爽快遍历和着色以及定向畛域框。这些新的爽快跟踪中枢提供了芯片上最大的性能升迁之一。每个爽快加快器也得到了调动:

2x 盒子和三角形交叉单位

硬件实例挪动

调动 RT 堆栈照顾

BVH8 和调动的节点压缩

定向畛域框

这些新的爽快跟踪升级还大大镌汰了 BVH 的内存要求。平均而言,收货于 8 宽筹办,RDNA 4 可将内存要求镌汰至 RDNA 3 的 60% 以下。

但这并不是全部。AMD 还推行了一种新的处分决策,通过对每个框进行旋转编码来更清雅地绑定所包含的几何图形,从而镌汰遍黄历钱,同期将框与几何图形对皆不错匡助摒除大部分空间,何况射线标的在参预框时会进行挪动以匹配编码的旋转。这不错减少遍历法子,通过摒除遍历热门来镌汰峰值本钱,并将遍历性能提高 10%。

这些变化的终结是,与 RDNA 3 比拟,RDNA 4 CU 在换取的时钟速率和带宽下提供了 2 倍的爽快遍历性能。

还有一个调动的号令处理器,它具有增强的数据包加快器。缓存也得到了升级,刻下愈加均衡,具有高达 64 MB 的第三代 Infinity Cache、8 MB 的 L2 缓存和 2MB 的团聚 CU 缓存。在内存方面,RDNA 4 GPU 架构保留了对 GDDR6 的守旧,但已升级到更快的速率,最高可达 20.00 Gbps,容量高达 16 GB,并配有 256 位总线接口。RDNA 4 还剿袭了增强的内存压缩技能来收缩可用带宽的压力。

关于 AI,AMD 正在愚弄其第三代矩阵加快引擎,该引擎具有调动的张量密集率、新的 8b 浮点数据类型、结构化稀疏性守旧和基于 ML 的升级或超分辩率。

与 RDNA 3 比拟,RDNA 4 CU 在 FP16 的圭臬场景中将图像生成性能提高了 2 倍(SDXL 1.5)。

媒体引擎剿袭双宽度筹办,配备更新的编码/解码引擎,AVC、H.264、H.265 质料升迁高达 25%,AV1 否认量翻倍,并针对低蔓延流媒体进行了优化。临了,还有更新的 Radiance 袒露引擎,它刻下守旧 DisplayPort 2.1a、HDMI 2.1b 输出和更新的缩放和锐化引擎。

RDNA 4 框图(顶部 Navi 48 芯片)

接下来,咱们转到代表齐备 Navi 48 GPU SKU 的 RDNA 4 框图。RDNA 4 GPU 剿袭台积电 4nm 工艺节点制造,具有多达 539 亿个晶体管,SKU 尺寸为 356.5mm2。该芯片还完全稳妥 PCIe Gen5 圭臬。

刻下是时候隔断 RDNA 4 芯片了。Navi 48 GPU(Radeon RX 9070 XT)由四个着色器引擎构成,每个引擎都包含多个“双计算单位”,而不是 WGP。每个双计算单位都有两个计算单位,每个着色器引擎悉数有 8 个 DCU 或 16 个 CU。芯片自己悉数有 32 个 DCU 或 64 个 CU,悉数有 4096 个流处理器或着色器单位。

每个 DCU 都有两个爽快加快器引擎,每个着色器引擎悉数有 16 个 RA,悉数有 64 个 RA,而每个 DCU 还包含 4 个矩阵加快引擎,每个着色器引擎悉数有 32 个 MA,悉数有 128 个 MA。每个着色器引擎还包含四个 RB+ 块、一个光栅化器引擎和一个 Prim Unit 块。芯片外围有四个第三代无尽缓存部分和四个 4x16 位内存限度器。

L2 缓存位于 GPU 的正中间,其中还包括两个 Geometry 处理器、两个 ACE 单位以及 HWS 和 DMA 各一个。该芯片使用 Infinity Fabric 开通。

AMD 的将来之路

在 PC 游戏限制,爽快跟踪世俗被视为落后的术语。天然,它是一种跟踪爽快的体式,不错使场景看起来更传神,何况刚刚运转在游戏机限制赢得关怀,但竞争敌手时常使用另一种类型的爽快跟踪器,称为旅途跟踪。天然爽快跟踪使用单个主爽快在光源上投射反射、暗影和折射,但旅途跟踪使用扫数可能的爽快旅途,何况是一种更斯文的技能。

NVIDIA 的旅途跟踪技能在《赛博一又克 2077》或《心灵杀手 II》等游戏中可见一斑,这些游戏被视为对图形要求最高的游戏之一,而且画面终结也统统令东说念主咋舌。通过升级和帧生成等新技能,旅途跟踪得以终了,但 Green 团队还投资了一项名为“爽快重建”的全新技能,该技能通过移除引擎内的降噪器并使用 AI/ML 匡助重新评估和重建图像,匡助更有用地终了旅途跟踪。

看起来 AMD 也剿袭了这种设施,并剿袭我方的神经超等采样和去噪技能来终了 RDNA 4 的旅途跟踪功能。

升级的媒体和袒露功能

若是不评论媒体和袒露引擎,咱们就不成终局此次潜入探讨。因此,当先,咱们当先先容新的媒体引擎,它通过以下式样提供增强的游戏流媒体和录制功能:

H.264 低蔓延编码质料升迁 25%

HEVC 编码质料升迁 11%

B 帧提高了 AV1 编码服从

720p 编码性能升迁高达 30%

针对 FFMPEG、OBS 和 Handbrake 进行了优化

VCN 低功耗视频播放(AV1 和 VP9 性能升迁 50%)

袒露体验也得到了改善,增强的 FreeSync 电源优化边幅可在大大都双袒露器成立中提供更低的适意功率,硬件翻转队伍守旧可将视频帧调遣卸载到 GPU 并省俭 CPU 功率以进行视频播放,而 Radeon 图像锐化 2 可提供高质料的图像和场景,并通过单个切换在扫数 API 上使命。

https://wccftech.com/amd-rdna-4-architecture-deep-dive-new-compute-units-raytracing-cores-ai-enhancements-path-tracing/

半导体宏构公众号推选

专注半导体限制更多原创本质

关怀大师半导体产业动向与趋势

*免责声明:本文由作家原创。著作本质系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或守旧,若是有任何异议,迎接斟酌半导体行业不雅察。

今天是《半导体行业不雅察》为您分享的第4050期本质,迎接关怀。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

心爱咱们的本质就点“在看”分享给小伙伴哦



TOP