英特尔2022年投资者大会上英特尔数据中心与人工智能事业部(DCAI)发布产品路线图
英特尔Sierra Forest处理器采用英特尔的能效核,为云服务提供商打造具备更多内核的平台。此前传闻Granite Rapids是专门的性能核处理器,而英特尔则在2022年投资者大会上分享了用于Sierra Forest平台的其它芯片。英特尔表示,其计划在下一代平台中提供两种具有通用高级平台功能的内核。这在许多方面与AMD的Genoa和Bergamo非常相似。这也正是英特尔所需要的。
Sierra Forest,英特尔能效核至强处理器
现阶段,在数据中心市场英特尔面临严峻挑战。尽管英特尔拥有“性能核”的超高性能内核,能够实现最高的单核或单线程性能。正如在AWS EC2 M6i实例中展示的那样,这些内核包含AVX-512等特性,在加速某些工作负载方面表现出色。但由于性能核必须将整个晶片面积专用于这项功能,也导致许多云工作负载根本无法充分利用这些额外的加速和性能。
2021年英特尔架构日上Gracemont Intel 7概览
然而对于诸如大型云服务提供商等英特尔客户,则并非如此关心高性能计算加速。相反,他们看重的是ECU/vCPU的整数和浮点运算性能。如果是以牺牲内核密度为代价,可能无法满足他们应用的需求。
第12代英特尔酷睿的性能核、能效核架构转变
而且,一个能效核目前占用的空间只有性能核的约四分之一,基于此,英特尔Sierra Forest采用能效核,打造专门针对以上工作负载的CPU。这让英特尔能够在相同的封装内放入更多内核。
2021年英特尔架构日,Gracemont高能效PPA设计
借鉴行业做法,英特尔正以Granite Rapids处理器转向新的芯片设计方案。在分享中,英特尔也提到该处理器正在通过I/O而分解非核心功能,而这也正是AMD在2019年发布的霄龙Rome中采用的I/O晶片方案。
AMD霄龙Rome 2P 128x PCIe In Red 128x S2S
这种方案意味着英特尔能够在特定芯片所需的计算晶片中使用通用的插槽、固件、平台和开关,这不仅为未来使用异构计算单元铺平了道路,也将对未来的产品设计产生深远影响。这类似于AMD在将于2022末/2023年发布的Genoa和Bergamo中采用的方案。
然而,这其中也有一个重要的细微差别。由于Ampere Altra和Graviton2等Arm芯片更像是能效核的集合,再加上由制程工艺领先于英特尔的台积电来制造,因此英特尔在PPA方面也受到Arm的冲击。现阶段英特尔处理器的能效可能不如Arm,但当英特尔拥有卓越的制程技术和更高的产量时,Arm就无法与之竞争了。凌动系列拥有能效核的血统,特别是凌动C2000系列中的Avoton和Rangeley有效地把Arm困在低端市场近十年的时间(C3000系列将在稍后推出)。
第32届Hot Chips大会,英特尔Ice Lake-SP 28核晶片
一旦英特尔在这些芯片发布时能够追平制造工艺,关于PPA的讨论就会更加多样化。假设Arm的能效比x86高50%,也并不意味着它一定可以多容纳50%的内核。但现阶段许多人做出了错误的假设,需要注意的是,用于缓存、PCIe/CXL I/O、内存接口等的芯片面积也非常大。上图可以查看芯片中内核与其它所有设备所占的比例。
英特尔2022年投资者大会上英特尔数据中心与人工智能事业部(DCAI)发布产品路线图
因此,能效核至强处理器让英特尔真正有机会成为市场上现有Arm解决方案的直接竞争对手,特别是它现在计划采用新的Intel 3制程工艺。
英特尔更新性能核路线图,内含Emerald Rapids和Granite Rapids
在性能核方面,英特尔介绍了采用Intel 7制程工艺的Sapphire Rapids的最新情况。除了HBM之外,英特尔还有一些非常领先的技术会用于SPR。对此,英特尔表示,Sapphire Rapids将在2022年第一季度开始出货,并将在3月向第一批客户提供首批产品。
英特尔2022年投资者大会上英特尔数据中心与人工智能事业部(DCAI)的Sapphire Rapids
此外,还有一个值得注意的产品——Emerald Rapids。在此前的一篇报道中,我们曾经谈到了这款产品。在今年的投资者大会中,计划在2023年面世的Emerald Rapids被称为“下一代至强”和“集成HBM的下一代至强”。英特尔表示,它的插槽将兼容Sapphire Rapids平台。
与此同时,英特尔也宣布Granite Rapids和Sierra Forest将采用Intel 3制程工艺。
结束语
总的来看说,我们对 Sierra Forest 充满期待,这种类型的芯片非常适合多样化的工作负载,甚至也能实现Web托管。现阶段我们最需要的,就是这些芯片能够进入市场,投入使用。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。