近日,在2023 NAVIGATE领航者峰会上,紫光股份旗下新华三集团重磅推出智算网络“利器”—— 全球首发51.2T 800G CPO硅光数据中心交换机(H3C S9827系列)。该产品单芯片带宽高达51.2T,支持64个800G端口,并融合CPO硅光技术、液冷散热设计、智能无损等先进技术,全面实现智算网络高吞吐、低时延、绿色节能三大需求,以高品质网络联接助力AIGC时代极致算力释放。
当前AI应用蓬勃发展,大模型应用催生超大规模算力需求,网络作为关作为数据交互的基础支撑,将加速向高带宽、低功耗、低时延方向演进。着眼底层技术,高速传输与低功耗之间的平衡是永恒的难题,基于能效和成本的考量,CPO(Co-packaged optics,共封装光学)技术站上风口,或将成为AI高算力需求下降低能耗、成本的必由之路。
高吞吐:单集群吞吐量提升8倍
由于数据中心内部流量极大,通常采用无阻塞网络架构,该架构高度依赖单端口速率,800G CPO硅光数据中心交换机的问世,带来的价值远不止单端口的提速,还将对无阻塞网络架构的整体能力产生指数级的放大效果。产品支持64个800G端口设计,单芯片带宽达51.2T,可支撑单个AIGC集群规模突破3.2万台节点,是采用400G交换机时代的8倍。在完全满足中大规模AIGC集群无阻塞传输需求的基础上,进一步降低能耗和成本、提升稳定性和可靠性、简化网络管理,从而最大程度保障AIGC集群的运算效能。
低时延:单位时间内GPU运算效率提升25%
数据吞吐量和传输速率是两个不同的命题,数据吞吐量指在单位时间内能够通过网络传输的总数据量,传输速率则通常指每秒传输的数据量。AIGC集群进行分布式深度学习训练时,不同节点之间需频繁地同步模型参数,一旦出现网络延迟问题,将会对训练效率和结果产生严重影响,因此对于网络时延有着极高要求。H3C S9827在高吞吐量基础之上,基于CPO硅光技术的应用,将单端口传输时延再度降低20%,这意味着在单位时间内,AIGC集群中GPU的数据交互能力可以提升25%,大大提升GPU的运算效率。
绿色:“硅光+液冷”融合应用实现单集群TCO降低30%
作为数字产业的“耗能大户”,AIGC持续升温也让数据中心的“能耗焦虑”日益加剧,在“双碳”战略目标指引下,数据中心绿色高质量发展已成为主旋律。H3C S9827搭载先进的CPO硅光技术,将数据信号从传统的PCB互联直接跨越到光IO互联,极大降低了芯片用于克服传输阻抗所付出的功耗,实现单集群内的TCO降低30%,有效助力绿色数据中心网络建设。与此同时,产品在散热上采用“风冷+液冷”组合方案,前后直通风道满足机房前进风、后出风的布局需求,后置并联风扇框实现风扇框N+1冗余,让系统散热更高效、更可靠;此外,产品核心部件采用全液冷设计,液冷散热量占比超过83%,全面实现单集群TCO降低30%。
高吞吐、零丢包、低时延 智能无损新体验
作为智算网络“利器”,H3C S9827内置AI ECN调优算法、RDMA、智能限速、AI节能等众多功能模块。AI ECN可采集关注流量的特征,确保队列实现低时延和高吞吐效果,满足集中式、分布式智能无损网络分析;RDMA技术将计算、存储、IP网络“三网合一”,提高网络吞吐量,降低网络延迟,带来高吞吐、零丢包、低时延的智能无损新体验。
厚植沃土,萃就精华。新华三集团深耕网络二十余载,致力于先进网络技术的探索和创新,此次800GCPO硅光数据中心交换机新品发布,是新华三全面拥抱AIGC时代、引领数据中心网络变革的又一力作。未来,新华三将秉持“精耕务实,为时代赋智慧”的理念,持续提升云智原生数字平台的能力,为数字经济高质量发展夯实智能联接基石。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。