IT天空

 找回密码
 加入我们

手机号码,快捷登录

搜索

[新资讯] Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

[复制链接]
ShuoShuRen 发表于 2021-8-20 09:15:57 | 显示全部楼层 |阅读模式

IT天空 定制版高速U盘 128G | 固态U盘 256G Pro/512G Pro
本帖最后由 ShuoShuRen 于 2021-8-20 09:18 编辑

  Intel Alder Lake 12代酷睿将采用全新的大小核混合架构设计,其中大核/性能核(P-Core)基于Golden Cove架构,最多8个,小核/能效核(E-Core)基于Gracemont架构,最多也是8个。两种架构的核心有何差异?一年一度的架构日活动上,Intel终于揭开了它们的神秘面纱。

090550ysys8byzlpu37mn7.jpg


  当然,CPU架构设计是极为高深的,一般人把握不了,也无需研究太多,我们这里大致过一下最关键的一些技术点。

090550rd6mmu6am9gmt8at.jpg


  Golden Cove是此前10代酷睿Sunny Cove、11代酷睿移动版Willow Cove、11代酷睿桌面版Cypress Cove的进一步升级版,但变化非常大,大量基础模块都重构或升级,其设计理念也将影响未来多代产品的演化。

  负责指令拾取和解码的前端部分,就发生了翻天覆地的变化,号称近十年来的最大变革,堪比当年的Skylake,官方称它旨在提高速度、突破低时延和单线程应用程序性能的限制。

  最直接、最明显的就是解码器宽度由4个升级为6个,这可是x86架构的第一次,同时每时钟周期执行uop从6个增至8个,解码长度从16字节翻番至32字节。?op缓存、队列也都大大强化,缓存可达4K,队列每线程可处理72条目,单线程达144个。

  编码预取大大增强,分支目标从5K增至12K,4K iTLB、2K/4M iTLB分别翻番至256、32,同时改进了分支预测精度,编码预取机制更加智能。

090550i0lqx1wtnnxs60sx.jpg


  乱序引擎部分,同样更宽、更深、更智能,分配由5路增至6路,执行端口由10个增至12个,调度器尺寸增大,重排序缓冲区(ROB)从352条目增至512条目,两倍多于AMD Zen3,仅次于苹果M1(大约630条目),重命名和分配阶段也可以执行更多指令。

090551hfo11tov8xo1dor5.jpg


  整数执行引擎部分,增加了第五个整数执行端口,所有五个端口都可以执行ALU、LEA,理论上就原生ALU吞吐能力而言是最宽的x86内核。

090551j1spl5qd77knln77.jpg


  矢量执行引擎部分,增加了新的快速加法器(FADD),比传统FMA单元效率更高、延迟更低,FMA单元则增加支持FP16浮点数据类型,属于AVX-512指令集的一部分。

090552bas0jvm8dmvcxaz8.jpg


  载入和存储部分,通过载入AGU增加了一个专用的执行端口,这样载入端口从2个增至3个,同时载入缓冲和存储缓冲更深,载入延迟更低,而针对当今负载不断增加的内存级并行需求,数据处理能力也大大增加。

090552lfd2yv88c8hyphyd.jpg


  二级缓存,桌面和移动端每核心还是1.25MB,服务器端的Sapphire Rapids则增加到2MB,并支持多路径预取、全写入预测带宽优化,可减少内存读取。

090552ufc1c16q2q3zp1ni.jpg


  Intel宣称,Golden Cove架构相比于现在11代酷睿桌面上的Cypress Cove,实现了平均大约19%的IPC(每时钟周期指令数)提升,可以理解为同频性能的提升幅度。

  它还支持AMX高级矩阵扩展指令,内置下一代AI加速技术,用于学习推理和训练,包括专用硬件和新指令集架构,可明显提高矩阵乘法运算。

090553ltiitxgq5x2qfqmv.jpg


  Gracemont小核心属于Atom凌动家族,是2008年以来的第七代,之前分别是Bonnell、Saltwell、Silvermont、Airmont、Goldmont(包括Plus版本)、Tremont。

  按照Intel的说法,Gracemont核心非常迷你,一个Golden Cove大核心的空间里,可以放入四个Gracemont小核心,以及它们共享的4MB二级缓存。

090553j37p7hpn66hzhzpu.jpg


  别看是小核心,性能其实一点都不弱。Intel声称,单核单线程对比,Gracemont的同频性能相比六代酷睿Skylake提升超过40%,而同等性能下功耗则可降低40%。

  四核四线程的Gracemont对比双核四线程的Skylake,峰值性能可提升80%,而同等性能下功耗可降低80%。

  Intel表示,这种小核心设计可以在有限的芯片空间内,实现多核任务负载,并具备宽泛的频率范围,降低整体消耗,为更高频率运行提供果功耗和散热空间,满足更多动态任务负载。

  它还可以利用各种技术进步,在不额外增加功耗的情况下,对工作负载进行优先级排序,并直接提升性能。

090554wgy16q6zwbtcytsd.jpg


  架构方面,小核心就相对简单不少了,但变化也非常大,比如指令缓存增大至64KB,可在不耗费内存子系统功率的情况下保存可用指令,还有Intel的第一个按需指令长度解码器,可生成预解码信息,加速现代工作负载。

  同时借助更深的分支历史、更大的指令尺寸,分支预测精度大大增加,拥有5000个条目的分支目标缓存区。

090554sv2880rkq3xrvr7k.jpg


090555mn5e1x58lxlkrree.jpg


  后端也更宽了,具备5组宽度分配、8组宽度引退、256个乱序窗口入口、17个执行端口,以及4个整数ALU、2个载入AGU、2个存储AGU、2个跳转端口、2个整数存储数据、2个浮点/矢量存储、2个浮点/矢量堆栈、以及第3个矢量ALU.

090555uo6856sboy0oqy58.jpg


  内存部分,使用了双载入、双存储单元的配置,二级缓存增大至4MB,以及深度缓冲、高级预取器,支持Intel Resource Director资源重定向技术,可以让软件在不同核心、不同软件线程之间实现精准的控制。

  哦对了,Gracemont是第一个支持AVX2指令集的能效核心,还支持整数AI操作新扩展、Intel控制流强制技术、Intel虚拟化重定向保护技术。

090556c0s7ad2y0o7m4tad.jpg









最近访问 头像模式 列表模式
fudashuai 发表于 2021-8-29 22:56:50 | 显示全部楼层

活跃 21467| 技术 0| 互助 0| 钻石 0

暴涨80%!令人吃惊啊!
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

ShuoShuRen

798

活跃

0

技术

0

互助
签到任务
最火的业界新闻
  • Mac最强散热秘密揭晓:新MacBook Pro内部结
  • 首发骁龙898!曝小米12系列年内或只发一款
  • 中兴AX5400 Pro路由器来了 吕钱浩:搭载自
  • 华为专家:5.5G网络能力将有十倍提升、终端
  • 高通发布新一代骁龙U!涵盖7系、6系、4系产
  • 安卓ROOT/玩机神器Magisk更新:正式支持And
  • 疑似小米12前面板CAD曝光:挖孔屏最佳方案
  • 首发骁龙898 4G!曝华为Mate 50系列供应链
  • 苹果加速与Intel脱钩:Intel芯片Mac将不支
  • 首批骁龙898!三星Galaxy S22 Ultra参数曝
炫酷的硬件Show
  • MARK 1 - 设计型 PC 与垂直风道
  • 好的大王,没问题大王
  • 振华SUPER FLOWER 铜皇450W 铜牌电源
  • 比小更小,Mini-STX装机
  • 华擎X99E-ITX + 银欣ML06 装机记
  • 最强双路泰坦硬管水冷 制作流程
  • 银欣FT02,双路E5工作站
  • 迟到的定制机箱小钢炮清理灰尘
  • 乔思伯UMX1 Plus,小巧的家用综合主机
  • 分体水冷第二弹-Inwin 805 infinity
有趣的美图分享
  • 很有创意啊
  • 不然留着过年?
  • 火系魔法师煎蛋
  • 技术应用
  • 又当爹又当妈
  • 我为什么要上班?
  • 教你如何拍出两米大长腿的感觉。
  • 这也太萌了
  • 还是翻盖的
  • 老妈说她年轻时是村里的养猪能手
关注官方微信
快速回复 返回顶部 返回列表