新闻:在今日举行的Six Five峰会上,英特尔公布了其对基础设施处理器 (IPU) 的愿景。IPU是一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器 (CPU) 方面的开销,并充分释放性能价值。利用 IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。
Guido Appenzeller,英特尔数据平台事业部首席技术官表示:“IPU 是一种全新的技术类别,是英特尔云战略的重要支柱之一。它扩展了我们的智能网卡功能,旨在应对当下复杂的数据中心,并提升效率。在英特尔,我们致力于携手客户及合作伙伴构建解决方案、创造新型技术,而IPU 就是这种合作的典范。”
工作原理:IPU是一个可编程的网络设备,能够对数据中心内的基础设施功能进行安全加速,从而使系统级资源的管理更加智能。
通过IPU,云运营商可以转向完全虚拟化的存储和网络架构,同时保持超高的性能、以及强大的可预测性与可控性。
通过特定功能,IPU 可对数据中心中基于微服务架构的现代应用程序进行加速。 谷歌和 Facebook 的研究表明,微服务通信开销可消耗 22%到 80%的CPU性能。
借助IPU,云提供商可以安全地管理基础设施功能,同时为客户提供对CPU和系统内存功能的全面控制力。
IPU可以提供的能力包括:
•通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全。
•通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心。
•允许灵活的工作负载分配,提高数据中心利用率。
•允许云服务提供商根据软件速度对基础设施功能进行定制化部署
Patty Kummrow,英特尔公司数据中心事业部副总裁兼以太网产品部总经理表示:“英特尔与绝大多数超大规模云服务提供商建立了紧密的合作关系。通过至强D、FPGA和以太网组件的广泛部署,英特尔已在IPU市场出货量上位于领先地位。英特尔首个基于 FPGA 的 IPU 平台已为多个云服务提供商完成部署,我们的首款 ASIC IPU 也正在测试中。”
百度主任系统架构师王雁鹏表示:“百度和英特尔在IPU领域展开全面合作,基于英特尔的IPU解决方案,百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一,极大地赋能了百度云主机产品。”
下一步:英特尔将推出更多基于FPGA的IPU平台和专用 ASIC,这些解决方案建立在强大的软件基础之上,使客户能够构建领先的云编排软件。
重要意义:不断演进的数据中心将需要一个全新的智能架构。这一架构内,大规模分布式异构计算能够协同工作,无缝连接,形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。 这种智能数据中心架构将拥有三类计算单元——用于通用计算的 CPU、用于特定应用或特定工作负载加速的 XPU 以及用于基础设施加速的 IPU——它们将通过可编程网络相互连接,从而有效利用数据中心资源。
更多背景:为什么你在未来数据中心上的思考大错特错?(孙纳颐演讲)|
IPU如何解决客户所面临的日益复杂的挑战?更多信息,敬请观看英特尔在Six Five峰会上的精彩演讲。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。