IT天空

 找回密码
 加入我们

手机号码,快捷登录

搜索

[新资讯] AMD RX 6000架构揭秘:性能提升多达54%

[复制链接]
Lacy 发表于 2020-11-19 09:35:12 | 显示全部楼层 |阅读模式

IT天空 定制版高速U盘 64G/128G/256G | 固态U盘 256G Pro/512G Pro
本帖最后由 Lacy 于 2020-11-19 09:36 编辑



  纸面发布多日之后,AMD RX 6000系列显卡今天终于开始解禁上市了,首发两款型号,RX 6800 4599元,RX 6800 XT 5099元,下个月2号还会有旗舰级的RX 6900 XT 7999元。它们都采用了升级版的RDNA 2底层架构,均基于Navi 21 GPU核心,也常被叫做Big Navi,最多拥有80组计算单元、5120个流处理器、16GB GDDR6显存,支持PCIe 4.0。

1 (1).png
1 (2).png


  而在7nm工艺不变、核心规模翻番、频率大幅提升的同时,整卡功耗依然保持在最多300W。

  本文中,我们重点讲讲RDNA 2的架构设计,以及两项关键图形技术。

1 (3).png


  RDNA 2虽然是RDNA架构的更新版本,并不是完全重新设计,但是它带来的突破和提升是惊人的,也完全实现了项目起步之初设立的看似不可能的目标。

  这就是:16个月之内,性能提升1倍,能效提升至少50%,完整支持DX12 Ultimate等技术特性,支持硬件光线追踪。

  在微架构上,RDNA 2充分借鉴了Zen CPU的世界级设计思路(消息称Zen开发团队直接介入了RDNA 2设计),整体得以更加精炼、高效。

  纵向比较的话,在同等功耗水平下,RDNA 2每个计算单元的运行频率提升了足足30%,标称加速频率最高2250MHz,实际运行中其实能够跑到2450MHz!

  横向比较的话,在同等频率下,RDNA 2每个计算单元的功耗可以降低50%,也就是省电一半。

1 (4).png

1 (5).png


  以上是RDNA、RDNA 2两代架构图,可以发现整体布局没有太大变化,当然各个功能模块都是调整优化过的,而最突出的,一是增加了独立的Infinity Cache高速缓存,二是在每个计算单元内加入了专用的光追加速器Ray Accelerator。

  至于RDNA 2架构的底层细节,比如说计算单元的变化,AMD这次没有给出更多资料,只是简单提到了几点,包括精简TLB以降低延迟、重新设计32位像素流水线并支持HDR格式、优化几何分派与曲面细分、全方位精细时钟门控、频率树分离与门控、最小化数据转移、重新平衡流水线、高性能库等等,但没有任何图示。

  不过也好,太深入太专业的东西咱们也钻研不够,直接享受成果就是了。

1 (6).png


  Infinity Cache高速缓存的加入,以及一二级缓存的调整,主要是为了解决RDNA 2架构必须在核心数量翻番、频率提升30%的情况下,不会受到带宽不足的制约。

  上一代的RDNA架构中,零级缓存分布在每个计算单元中,一级缓存是每个着色器引擎独享的,并单独访问二级缓存,4MB二级缓存则负责在着色器引擎、指令处理器之间共享数据。

  RDNA架构搭配的是256-bit GDDR6显存,等效频率14GHz,总带宽为448GB/s,看起来不少,但核心规模急剧扩大后,就会成为瓶颈。

  GPU发展的传统思路中,提升显存带宽的核心途径就是扩大位宽、提高频率。RTX 3090就拥有384-bit 19.5GHz GDDR6X,带宽高达936GB/s,AMD Fury、Vega系列显卡还用过以高带宽着称的HBM,Radeon VII就达到了惊人的1TB/s。

  但是,扩大位宽会造成核心面积急剧扩大、功耗急剧增加,HBM显存则是成本高昂,还要与GPU整合封装。

1 (7).png


  Smart Access Memory(SAM)显存智取技术就是AMD提出的更高效的高带宽解决方案,而且充分依托了AMD的平台化优势。

  NVIDIA虽然号称也在研发类似的技术,但没有自己的CPU处理器做辅助,就有点像无根之水了。

  RDNA 2为此集成了128MB大容量的Infinity Cache高速缓存,有点像锐龙/霄龙处理器中的三级缓存,同时优化各级缓存结构的体系,还将二级缓存容量翻两番达到16MB。

  再结合AMD CPU/GPU通用的Infinity Fabric高速互连通道,支持16x64-bit通道,最高频率1.94GHz,其带宽是256-bit GDDR6显存的几乎4倍!

1 (8).png


  按照AMD的说法,Infinity Cache高速缓存结合256-bit GDDR6显存,带宽可以达到384-bit GDDR6显存的多达2.17倍,而且还能节省10%的功耗——512-bit GDDR6或者4096-bit HBM也能带来类似或者更高的带宽,但是功耗和成本完全不可同日而语了。

  与此同时,平均显存延迟也降低了足足34%。

1 (9).png


  再借助成熟的PCIe 4.0技术、自家平台优势,锐龙5000处理器、RX 6000显卡彼此搭配的时候,SAM技术可以将更多内存空间映射到本地存储地址寄存器中,让处理器访问显卡全部容量的显存,不再有任何限制,也彻底消除了带宽瓶颈。

1 (10).png


  SAM技术加持后,不但带宽瓶颈完全不存在,还有额外加成,官方宣称可给RX 6800 XT带来平均6%的游戏性能提升,最多超过10%。

  在我们的实测中,RX 6800 XT开启SAM,游戏性能平均提升大约3%,《刺客信条:奥德赛》、《古墓丽影:暗影》、《战地5》、《战争机器》都是比较明显的,以前是《战争机器5》,1080p分辨率下达到了惊人的12%。

  回想之前RX 6000系列规格曝光的时候,看到只有256-bit位宽,再加上AMD保密措施做得好,顶级规格一直没有透露,相信绝大多数人都认为AMD这次直接弃疗了,不做高端,结果谁都没想到来了一个这么一个独门大招。

  当然,SAM技术需要特定的条件才能开启,硬件上不但需要锐龙5000处理器、RX 6000显卡,还得搭配X570、B550主板,并在BIOS中开启相关选项。

  AMD表示,目前没有计划将SAM技术应用于老平台,所以400系列主板用户即便上了锐龙5000处理器,也会少一些"福利"。

1 (11).png


  再说说光追。RDNA 2的思路是在每一个计算单元内,加入一个专门的Ray Accelerator光追加速单元,这与在微软Xbox Series X/S、索尼PS5上的设计如出一辙,跨平台的游戏优化自然是得心应手。

  对比NVIDIA RT Core专用光追核心的做法,RDNA 2将光追加速器集成于计算单元,可以共享通常无法在光追中无法被完全利用到的硬件。

  换言之,运行非光追负载时,AMD光追加速器的部分硬件仍然可以正常运作,NVIDIA RT核心就完全闲置了,前者自然有着更高的整体效率,不必为根本用不到的硬件付出成本和功耗。

  关于光追游戏支持,RDNA 2架构基于行业标准的微软DXR API和即将推出的Vulkan光追API,所以任何基于这些标准API的光追游戏,AMD都可以直接支持,首发超过十款,包括《尘埃5》、《众神陨落》、《孤岛惊魂6》、《银河破裂者》、《魔兽世界:暗影国度》、《战地5》、《使命召唤:现代战争》、《孤岛危机重制》、《堡垒之夜》、《地铁:离去》、《古墓丽影:暗影》、《看门狗:军团》。

1 (12).png

1 (13).png


  这是AMD放出的RNA 2光追渲染效果图,注意第一张和传统光栅化渲染的对比。

1 (14).png


  AMD声称,相比于软件方案,RDNA 2架构的硬件加速光追性能,可以提升10倍之多,同时给出了部分游戏的实际性能,2K分辨率下《使命召唤:现代战争》可以跑出95FPS,《孤岛危机重制版》可达90FPS,《战地5》能有70FPS。

1 (15).png


  还有一点很多人可能没注意到,光追不仅仅可以用于游戏,在图形渲染中同样很关键,而且早就有应用了,只不过一直都是软件方案,效率不是很高。

  AMD ProRender渲染器插件就一直支持光追,支持Blender、Houdini、Autodesk Maya等顶级渲染软件,Blender Cycles也即将支持

  AMD声称,RX 6800 XT相比于此前的Radeon VII,利用硬件光追加速,在渲染方面可以带来大约50-70%的性能飞跃。

1 (16).png


  另外,针对NVIDIA DLSS深度学习超采样抗锯齿技术,AMD也提出了超分辨率(FidelityFX Super Resolution),简称FSR,不过还在开发之中,正与游戏开发商联合优化支持,更多细节会在后续放出。

1 (17).png

1 (18).png


  总的来说,基于一系列全新设计和特性,RDNA 2架构在运行频率、同频性能、能效比等各个方面都取得了显着的进步,综合能效比在RDNA相对于GCN提升50%的基础上,又提升了多达54%!这其中,21%来自同频性能增强,17%来自能耗优化,16%来自设计频率提升。

  最后是一组AMD官方给出的RX 6800、RX 6800 XT与竞品性能对比,看看就好,实际性能对比还请移步本站的首发评测。

1 (19).png

1 (20).png

1 (21).png

1 (22).png

1 (23).png














fudashuai 发表于 2020-11-19 22:46:06 | 显示全部楼层

活跃 14775| 技术 0| 互助 0| 钻石 0

性能提升再多,也买不起啊!
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Lacy

53712

活跃

2

技术

9

互助
签到任务
最火的业界新闻
  • 开发者现身说法 苹果M1芯片为何比高端英特
  • 联想发布拯救者Y9000X/R9000X 2021游戏本:
  • 拆机发现PS5混用不同散热器 实测散热效果有
  • Mini-LED M1 MacBook Pro和Mini-LED iPad P
  • 外媒绘制一加9 Pro渲染图:细节程度堪比官
  • RX 6700 XT核心频率极限2.95GHz:超过RX 68
  • M1 MacBook Air电池表现实测:续航长了、充
  • A78芯加持 联发科新SoC曝光:跑分超骁龙865
  • 制造1nm芯片的EUV光刻机:ASML已完成设计
  • AMD制定RX 6800系列显卡命名规范:全名多达
炫酷的硬件Show
  • 振华SUPER FLOWER 铜皇450W 铜牌电源
  • 比小更小,Mini-STX装机
  • 华擎X99E-ITX + 银欣ML06 装机记
  • 最强双路泰坦硬管水冷 制作流程
  • 银欣FT02,双路E5工作站
  • 迟到的定制机箱小钢炮清理灰尘
  • 乔思伯UMX1 Plus,小巧的家用综合主机
  • 分体水冷第二弹-Inwin 805 infinity
  • 第一次DIY硬管水冷~~
  • 樱桃MX6.0 青轴 机械键盘 开箱
有趣的美图分享
  • 现代别墅
  • 爽!
  • 我怀疑这也是人类的未来
  • 没错这是东北的冬天
  • 大金链子,这事儿太完美了
  • 真是这样啊
  • 赤裸裸的报复
  • 啊这..一副假发都要做出来了
  • 穿秋裤了吗?
  • 成功接住玩具时的表情和没接住时的表情
关注官方微信
快速回复 返回顶部 返回列表