图1 Phoenix超级计算机标识
Phoenix超级计算机是东方超算与北京三轴空间科技共同合作研发的水冷超级计算机,部署于中国科学院大学雁西湖校区,服务于物理科学学院张余洋课题组,用于基于密度泛函理论的量子力学计算研究。
Phoenix具备56个双路英特尔至强铂金级9282处理器的计算节点,共有6272个计算核心,Linpack峰值521TFlops(每秒521万亿次双精度浮点计算能力)。
图2 Phoenix超级计算机部署实景
整套超级计算机部署在2套机柜空间内,全部计算节点部署于单机柜空间;管理网络、计算网络、管理节点、登录节点、存储节点、液冷控制单元(CDU)、环控设备集中部署于另一个机柜空间内。
集群架构介绍:
根据基于密度泛函理论的量子力学计算的应用运行特征,计算节点配置双路英特尔至强铂金级9282处理器(单颗处理器56核心/基础频率2.6GHz/最大睿频3.8GHz)、24条32GB内存、1块Omni-Path 100Gb网卡;系统管理网络与硬件管理网络共享板载千兆网卡,降低高密度部署中的网线密度;计算与存储网络配置2台48口Omni-Path 100Gb交换机,2台交换机之间1/3阻塞,在满足大规模计算网络通信需求的基础上将更多的预算用于提升计算能力。
图3 集群计算网络架构
散热制冷介绍:
图4 散热系统整机架构
计算节点采用冷板式与风冷双散热系统设计,散热系统分为三部分:1.一次侧干冷式冷塔2.二次侧液冷控制单元3.环境精密空调。
工作原理:
一次侧干冷式冷塔:采用自然风冷+压缩机补冷方案,冬季采用自然风冷散热、当自然风冷无法满足冷塔控制箱设定的供水温度时,压缩器启动补冷;
二次侧冷却分配单元:通过与一次侧换热,实现供应32摄氏度水给计算节点;
环境精密空调:计算节点运行中处理器与内存之外的热量通过机箱风扇散发至机房环境,需按照整机功耗20%来配置恒温恒湿精密空调。
冷板贴附在处理器和内存散热面,依靠流经冷板的液体将热量带走实现高效换热,主板、网卡、电源供应器等部件依靠冗余风扇实现风冷散热。
图5 计算节点机箱前/后视图
图6 节点冷却管路/冷却节点
使用Intel电源散热实用程序PTU查看节点满负载运行的状态,32摄氏度供水的情况下CPU核心温度为50-65摄氏度,相对于最高运行温度85摄氏度,供水温度仍具有较大升温空间。
图7 计算节点满负载运行状态
一次侧干冷式冷塔介绍:
图8 一次侧干冷式冷塔
图9 安装于机房内的冷塔控制箱和一次侧供回水管路
图10 一次侧干冷式冷塔控制箱界面
二次侧液冷控制单元介绍:
二次侧液冷控制单元采用CoolTera RM100机型,换热量100KW,4U高度内集成了双循环泵和换热器,提供了一次侧进回水口和二次侧进回水口,节省了机柜部署空间。
图11 CDU RM100冷量分配控制器
图12 CDU运行状态界面
图13 CDU供回水管路
北京东方超算科技有限公司是全球先进的超级计算机研发、制造和运营商,基于大数据、人工智能和超级计算应用的融合计算平台,提供超级计算机应用和服务。作为英特尔HPC数据中心专家,与英特尔、三轴空间和用户合作研发超级计算机Phoenix。
北京三轴空间科技有限公司是一流的高性能计算集群建设、运维团队,公司自有5000余套高性能计算节点,为科研、人工智能、影视特效等行业提供专业服务。三轴空间团队有丰富的高性能计算集群设计、运维、行业应用经验,旗下星海超算平台、RenderG云渲染平台在业内享有盛誉。
好文章,需要你的鼓励
知名的投资机构ICONIQ Capital发布了《开发者手册:2025年AI现状报告》,基于对300位企业高管的调研,包括CEO、工程负责人、AI负责人和产品负责人等关键决策者,涵盖了从初创公司到十亿美元巨头的各个发展阶段,深度剖析了当下企业AI产品应用的全貌,为我们呈现了一个从"如何构思、交付和规模化AI驱动业务"的完整路线。
中科大团队开发出LongAnimation系统,解决了长动画自动上色中的色彩一致性难题。该系统采用动态全局-局部记忆机制,能够为平均500帧的动画进行稳定上色,性能比现有方法提升35-58%。核心创新包括SketchDiT特征提取器、智能记忆模块和色彩优化机制,可大幅提升动画制作效率。
南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。