IT天空

 找回密码
 加入我们

手机号码,快捷登录

搜索

[新资讯] AMD RDNA计算卡架构揭秘:从零起步、三杀NVIDIA

[复制链接]
Lacy 发表于 2020-11-18 09:28:25 | 显示全部楼层 |阅读模式

IT天空 定制版高速U盘 128G | 固态U盘 256G Pro/512G Pro


  昨日晚间,AMD正式发布了新一代Instinct MI100计算卡,首次采用针对HPC高性能计算、AI人工智能全新设计的CDNA架构,和游戏向的RDNA架构截然不同。Instinct MI100计算卡采用台积电7nm工艺制造,集成120个计算单元、7680个流处理器,核心频率最高1502MHz,并专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算。

1 (1).png

1 (2).png


  它整合封装了32GB HBM2显存,位宽4096-bit,频率1.2GHz,带宽1228.8GB/s,支持ECC。

  该卡支持PCIe 4.0 x16,具备三条Infinity Fabric互连总线,峰值带宽92GB/s,整卡热设计功耗300W,双8针辅助供电。

1 (1).jpg

1 (2).jpg


  这块卡的特殊之处还在于顶部设置了桥接金手指,通过桥接器可以将四块卡绑定在一起,而搭配双路的AMD霄龙处理器,可以实现八卡并行。

1 (3).jpg

1 (4).jpg

1 (5).jpg


  类似之前的计算卡,甚至是R9 Fury X、Vega 64/56这样的游戏卡,Instinct MI110也是将GPU芯片、HBM芯片整合封装在了一起,不过如今的HBM2单颗容量已达8GB。

1 (6).jpg

1 (7).jpg


  对比CDNA(上)、RDNA(下)架构图,可以发现二者整体框架有些相似之处,但各种单元模块和布局已经截然不同。

  Infinity Fabric互连总线、显存控制器、PCIe 4.0控制器、多媒体引擎、着色器引擎、ACE异步计算引擎等等都还在(当然也不完全一样了),而和图形渲染输出相关的都没了,比如图形指令处理器、几何处理器、光栅器、显示引擎、原语单元等等,同时增加了XGMI连接控制器用于多卡互连,一二级缓存也完全不同。

1 (8).jpg

1 (9).jpg


  作为AMD GPU的最基本模块,计算单元(CU)也完全不同了,现在叫做增强型计算单元(XCU),组成模块包括调度器、分支与信息单元、12.8KB ECC标量单元、512KB ECC标量寄存器、矢量寄存器、矢量ALU操作单元、矩阵数据操作单元、四个矢量/矩阵SIMD单元、64KB ECC本地数据共享单元、载入/存储单元、16KB ECC一级缓存等等。

  显然,这一些都是为计算服务的,而用于图形的着色器、纹理相关单元自然都不见了,即便有些单元名字一样,规格和作用也不同了。

1 (3).png


  计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。

  这样的一块卡,已经相当于20年前的世界顶级超级计算机,而体积、功耗都不可同日而语。

1 (4).png


  对比NVIDIA安培架构的最新计算卡A100,AMD也给出了一些对比数据,FP32单精度性能领先18.5%,FP64双精度性能领先18.6%,AI与机器学习性能更是领先两倍多,而且功耗低了足足100W。

  而对比上代产品MI50,新卡的FP64双精度、FP32单精度性能均提升74%,FP32矩阵性能提升接近2.5倍,AI负载性能更是几乎7倍的飞跃。

  当然,除了纸面计算性能优秀,软件开发也必须跟上,尤其是这种计算性的产品。NVIDIA在这方面要强得多,生态更加稳固和丰富,AMD ROCm平台正在奋起直追中。

 













原文链接:https://www.cnbeta.com/articles/tech/1054631.htm

最近访问 头像模式 列表模式
fudashuai 发表于 2020-12-5 11:41:42 | 显示全部楼层

活跃 19677| 技术 0| 互助 0| 钻石 0

AMD势不可挡啊······
中国运动员加油!
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Lacy

59421

活跃

2

技术

9

互助
签到任务
最火的业界新闻
  • 显卡价格不再快速下降 等等党可能要多等几
  • 经典DOS游戏应用iDOS 2即将下架 苹果称违反
  • 知名模拟器前端RetroArch上架亚马逊AppStor
  • Google第二代Pixel Buds在美国市场官方渠道
  • Google上线东京奥运会涂鸦 致敬16位视频游
  • 柔性32比特微处理器问世
  • PineTime开源智能手表现已上市 仅售26.99美
  • “假芯片”正充斥市场 缺芯潮背后乱象起底
  • Satechi推出三款USB-C GaN充电器 功率分别
  • OWC推出Envoy Pro SX加固型Thunderbolt SSD
炫酷的硬件Show
  • MARK 1 - 设计型 PC 与垂直风道
  • 好的大王,没问题大王
  • 振华SUPER FLOWER 铜皇450W 铜牌电源
  • 比小更小,Mini-STX装机
  • 华擎X99E-ITX + 银欣ML06 装机记
  • 最强双路泰坦硬管水冷 制作流程
  • 银欣FT02,双路E5工作站
  • 迟到的定制机箱小钢炮清理灰尘
  • 乔思伯UMX1 Plus,小巧的家用综合主机
  • 分体水冷第二弹-Inwin 805 infinity
有趣的美图分享
  • 阿姨说的没毛病
  • 在医院忘带筷子的朋友
  • 这高级的仪式感
  • 这样就是100%没有烦恼了
  • 是不是你小姨的杰作
  • 对面的住户很心塞
  • 皮肤
  • 自相矛盾?
  • 海底进行篝火晚会
  • 什么冬梅啊
关注官方微信
快速回复 返回顶部 返回列表