5月22日,“2023年大湾区科学论坛”在广州成功举办,会议期间国家高性能计算机工程技术研究中心副主任曹振南介绍,伴随各行业应用对算力需求的持续增长,行业与区域算力分布不均问题凸显,而落实超算互联网行动方案,打造集应用、数据、算力服务于一体的超算互联网平台,将有助于破解此类问题,推动前沿科技创新与AI产业发展。
图说:曹振南 国家高性能计算机工程技术研究中心副主任
全国联网破解AI“算力荒”
人工智能的兴起,为各行业带来海量AI算力需求,但AI算力在不同区域、行业分布不平均,造成多行业存在巨大AI算力缺口。而超算互联网平台的建设目标之一,就是为解决算力设施分布不均衡的问题,实现超算资源的互联互通、资源共享。
曹振南介绍,目前正在研发中的超算互联网平台,可实现异地、异构算力中心的链接,依托集算力、应用、数据、社区等一体运营模式,实现包括AI算力在内的全国算力资源统筹与调度。当行业用户在研发AI应用时,无需投入海量硬件,依托超算互联网平台就可完成AI大模型训练等复杂计算任务。
充分释放超算创新潜力
近些年,我国的算力基础设施建设呈上升趋势,如何让这些基础设施发挥更大作用,让更多单位、个人便捷享用算力资源,近来一直成为行业关注热点。
曹振南表示,超算互联网平台最大的改变是从提供超算算力转变为提供超算算力服务和应用服务,并且将算力供应商、应用软件商、开发者、最终用户有机链接成一个超算生态圈,形成互利共赢的商业创新模式。
通过这个平台,一方面让用户可像“网上购物”一样便捷使用超算应用和算力服务,另一方面也让更多企业自主开发的应用能被更多用户看到和使用。“这将形成一个良性循环,有利于促进超算产业的高质量、可持续发展,更大地发挥超算在民生服务、社会治理等领域的创新引领作用”,曹振南说。
此外,超算用户社区作为超算生态圈的重要组成,让用户不仅可在社区内发布应用场景案例,还可分享使用经验,最终形成业务交流、需求发布、成果汇聚的社区网络,释放社会科研创新潜能。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。