IT天空

 找回密码
 加入我们

手机号码,快捷登录

搜索

[新资讯] 绕过CPU:英伟达与IBM致力推动GPU直连SSD以大幅提升性能

[复制链接]
Lacy 发表于 2022-3-18 10:02:50 | 显示全部楼层 |阅读模式

IT天空 定制版高速U盘 128G | 固态U盘 256G Pro/512G Pro


  通过与几所大学的合作,英伟达和 IBM 打造了一套新架构,致力于为 GPU 加速应用程序,提供对大量数据存储的快速"细粒度访问"。所谓的"大加速器内存"(Big Accelerator Memory)旨在扩展 GPU 显存容量、有效提升存储访问带宽,同时为 GPU 线程提供高级抽象层,以便轻松按需、细粒度地访问扩展内存层次中的海量数据结构。
  1 (1).jpg


  以 CPU 为中心的传统模型示例

  显然,这项技术将使人工智能、分析和机器学习训练等领域更加受益。而作为 BaM 团队中的重量级选手,英伟达将为创新项目倾注自身的广泛资源。

  比如允许 NVIDIA GPU 直接获取数据,而无需依赖于 CPU 来执行虚拟地址转换、基于页面的按需数据加载、以及其它针对内存和外存的大量数据管理工作。

  对于普通用户来说,我们只需看到 BaM 的两大优势。其一是基于软件管理的 GPU 缓存,数据存储和显卡之间的信息传输分配工作,都将交给 GPU 核心上的线程来管理。

  通过使用 RDMA、PCI Express 接口、以及自定义的 Linux 内核驱动程序,BaM 可允许 GPU 直接打通 SSD 数据读写。

  1 (2).jpg


  BaM 模型示例

  其次,通过打通 NVMe SSD 的数据通信请求,BaM 只会在特定数据不在软件管理的缓存区域时,才让 GPU 线程做好参考执行驱动程序命令的准备。

  基于此,在图形处理器上运行繁重工作负载的算法,将能够通过针对特定数据的访问例程优化,从而实现针对重要信息的高效访问。

  显然,以 CPU 为中心的策略,会导致过多的 CPU-GPU 同步开销(以及 I/O 流量放大),从而拖累了具有细粒度的数据相关访问模式 —— 比如图形与数据分析、推荐系统和图形神经网络等新兴应用程序的存储网络带宽效率。

  为此,研究人员在 BaM 模型的 GPU 内存中,提供了一个基于高并发 NVMe 的提交 / 完成队列的用户级库,使得未从软件缓存中丢失的 GPU 线程,能够以高吞吐量的方式来高效访问存储。

  1 (3).jpg

  BaM 设计的逻辑视图

  更棒的是,该方案在每次存储访问时的软件开销都极低,并且支持高度并发的线程。而在基于 BaM 设计 + 标准 GPU + NVMe SSD 的 Linux 原型测试平台上开展的相关实验,也交出了相当喜人的成绩。

  作为当前基于 CPU 统管一切事务的传统解决方案的一个可行替代,研究表明存储访问可同时工作、消除了同步限制,并且 I/O 带宽效率的显着提升,也让应用程序的性能不可同日而语。

  此外 NVIDIA 首席科学家、曾带领斯坦福大学计算机科学系的 Bill Dally 指出:得益于软件缓存,BaM 不依赖于虚拟内存地址转换,因而天生就免疫于 TLB 未命中等序列化事件。

  最后,三方将开源 BaM 设计的新细节,以期更多企业能够投入到软硬件的优化、并自行创建类似的设计。有趣的是,将闪存放在 GPU 一旁的 AMD Radeon 固态显卡,也运用了类似的功能设计理念。












原文链接:https://www.cnbeta.com/articles/tech/1248169.htm
最近访问 头像模式 列表模式
fudashuai 发表于 2022-3-18 18:25:22 | 显示全部楼层

活跃 25425| 技术 0| 互助 0| 钻石 0

有看头儿了!欢迎激烈竞争!
459500160 发表于 2022-3-20 17:52:19 | 显示全部楼层

活跃 6627| 技术 0| 互助 8| 钻石 200

照这趋势,是不是往后cpu会集成到主板上,显卡会变成现在的cpu呢?
roquwen 发表于 2022-3-21 09:13:55 | 显示全部楼层

活跃 803| 技术 0| 互助 0| 钻石 0

反过来让cpu集成在显卡上吧
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Lacy

64222

活跃

2

技术

9

互助
签到任务
最火的业界新闻
  • 小米总裁透露小米汽车进展:计划不变 正研
  • 小米一季度净利润腰斩 中国智能手机月销量
  • 未来苹果键盘可能有一个可拆卸按键作为鼠标
  • 今年手机市场有点难?日媒称安卓系砍单两成
  • 惠普推出2022款Spectre/Envy系列笔记本电脑
  • 国内智能手机销量连续10周下滑 连iPhone也
  • 小米2022年第一季度营收734亿元 净利润29亿
  • GTX 1630千元亮机卡全曝光:RX 6400轻松碾
  • 显卡行情调查:RX 6000比MSRP溢价5% RTX 30
  • 消息称NVIDIA GeForce GTX 1630显卡将于5月
炫酷的硬件Show
  • MARK 1 - 设计型 PC 与垂直风道
  • 好的大王,没问题大王
  • 振华SUPER FLOWER 铜皇450W 铜牌电源
  • 比小更小,Mini-STX装机
  • 华擎X99E-ITX + 银欣ML06 装机记
  • 最强双路泰坦硬管水冷 制作流程
  • 银欣FT02,双路E5工作站
  • 迟到的定制机箱小钢炮清理灰尘
  • 乔思伯UMX1 Plus,小巧的家用综合主机
  • 分体水冷第二弹-Inwin 805 infinity
有趣的美图分享
  • 老兄 这水怎么越来越热呀
  • 没电都急哭了
  • 没毛病,但又觉得哪不对
  • 其实我也是可乐教的
  • 诡计多端的销售
  • 反客为主
  • 反重力楼梯
  • 这buff叠满了,可惜有个de的前缀
  • 8bit猫
  • 这猕猴桃真青椒
关注官方微信
快速回复 返回顶部 返回列表