
英特尔2022年投资者大会上英特尔数据中心与人工智能事业部(DCAI)发布产品路线图
英特尔Sierra Forest处理器采用英特尔的能效核,为云服务提供商打造具备更多内核的平台。此前传闻Granite Rapids是专门的性能核处理器,而英特尔则在2022年投资者大会上分享了用于Sierra Forest平台的其它芯片。英特尔表示,其计划在下一代平台中提供两种具有通用高级平台功能的内核。这在许多方面与AMD的Genoa和Bergamo非常相似。这也正是英特尔所需要的。
Sierra Forest,英特尔能效核至强处理器
现阶段,在数据中心市场英特尔面临严峻挑战。尽管英特尔拥有“性能核”的超高性能内核,能够实现最高的单核或单线程性能。正如在AWS EC2 M6i实例中展示的那样,这些内核包含AVX-512等特性,在加速某些工作负载方面表现出色。但由于性能核必须将整个晶片面积专用于这项功能,也导致许多云工作负载根本无法充分利用这些额外的加速和性能。

2021年英特尔架构日上Gracemont Intel 7概览
然而对于诸如大型云服务提供商等英特尔客户,则并非如此关心高性能计算加速。相反,他们看重的是ECU/vCPU的整数和浮点运算性能。如果是以牺牲内核密度为代价,可能无法满足他们应用的需求。

第12代英特尔酷睿的性能核、能效核架构转变
而且,一个能效核目前占用的空间只有性能核的约四分之一,基于此,英特尔Sierra Forest采用能效核,打造专门针对以上工作负载的CPU。这让英特尔能够在相同的封装内放入更多内核。

2021年英特尔架构日,Gracemont高能效PPA设计
借鉴行业做法,英特尔正以Granite Rapids处理器转向新的芯片设计方案。在分享中,英特尔也提到该处理器正在通过I/O而分解非核心功能,而这也正是AMD在2019年发布的霄龙Rome中采用的I/O晶片方案。

AMD霄龙Rome 2P 128x PCIe In Red 128x S2S
这种方案意味着英特尔能够在特定芯片所需的计算晶片中使用通用的插槽、固件、平台和开关,这不仅为未来使用异构计算单元铺平了道路,也将对未来的产品设计产生深远影响。这类似于AMD在将于2022末/2023年发布的Genoa和Bergamo中采用的方案。
然而,这其中也有一个重要的细微差别。由于Ampere Altra和Graviton2等Arm芯片更像是能效核的集合,再加上由制程工艺领先于英特尔的台积电来制造,因此英特尔在PPA方面也受到Arm的冲击。现阶段英特尔处理器的能效可能不如Arm,但当英特尔拥有卓越的制程技术和更高的产量时,Arm就无法与之竞争了。凌动系列拥有能效核的血统,特别是凌动C2000系列中的Avoton和Rangeley有效地把Arm困在低端市场近十年的时间(C3000系列将在稍后推出)。

第32届Hot Chips大会,英特尔Ice Lake-SP 28核晶片
一旦英特尔在这些芯片发布时能够追平制造工艺,关于PPA的讨论就会更加多样化。假设Arm的能效比x86高50%,也并不意味着它一定可以多容纳50%的内核。但现阶段许多人做出了错误的假设,需要注意的是,用于缓存、PCIe/CXL I/O、内存接口等的芯片面积也非常大。上图可以查看芯片中内核与其它所有设备所占的比例。

英特尔2022年投资者大会上英特尔数据中心与人工智能事业部(DCAI)发布产品路线图
因此,能效核至强处理器让英特尔真正有机会成为市场上现有Arm解决方案的直接竞争对手,特别是它现在计划采用新的Intel 3制程工艺。
英特尔更新性能核路线图,内含Emerald Rapids和Granite Rapids
在性能核方面,英特尔介绍了采用Intel 7制程工艺的Sapphire Rapids的最新情况。除了HBM之外,英特尔还有一些非常领先的技术会用于SPR。对此,英特尔表示,Sapphire Rapids将在2022年第一季度开始出货,并将在3月向第一批客户提供首批产品。

英特尔2022年投资者大会上英特尔数据中心与人工智能事业部(DCAI)的Sapphire Rapids
此外,还有一个值得注意的产品——Emerald Rapids。在此前的一篇报道中,我们曾经谈到了这款产品。在今年的投资者大会中,计划在2023年面世的Emerald Rapids被称为“下一代至强”和“集成HBM的下一代至强”。英特尔表示,它的插槽将兼容Sapphire Rapids平台。
与此同时,英特尔也宣布Granite Rapids和Sierra Forest将采用Intel 3制程工艺。
结束语
总的来看说,我们对 Sierra Forest 充满期待,这种类型的芯片非常适合多样化的工作负载,甚至也能实现Web托管。现阶段我们最需要的,就是这些芯片能够进入市场,投入使用。
好文章,需要你的鼓励
滑铁卢大学研究团队开发出LOCKET技术,解决AI服务"按需付费"的商业化难题。该技术通过创新的"适配器融合"方式替代易泄露的密码验证,实现100%有效拒绝未授权功能,同时保持已授权功能性能损失不超过7%。面对恶意攻击的成功率控制在5%以下,为AI服务提供商提供了可行的精细化定价解决方案。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
KAIST研究团队开发出Diffusion-Link技术,通过扩散模型解决AI系统中音频与文字信息的"沟通障碍"。该技术采用轻量级设计,无需外部知识即可将音频特征转换为文字特征,在音频字幕生成任务上取得突破性成果,零样本性能提升52.5%,为多模态AI系统发展开辟新路径。