人工智能正持续为产业赋能,推动智慧农业、智能制造、智慧交通、智慧零售等行业发展,而算网融合也将成为实现产业智能服务的基础底座。近日,浪潮网络发布基于RoCE的无损以太网解决方案,该方案以浪潮高性能数据中心交换机组为核心,满足在AI集群、分布式存储、HPC集群、数据中心的网络要求,助力实现算力的无缝协同,释放数据潜能,为产业发展注入创新动能。
随着智算中心的发展演进,数据量呈指数级增长,数据流量对于算力和网络提出了更高要求。传统的数据中心服务以事件为基础,计算结果通常是确定的,单个事件和相应的网络通信之间几乎没有相关性或依赖性。而智算是迭代收敛优化的过程,数据集和算法之间存在高度的空间相关性,通信流之间具有强时间相关性,因此需要具备快速、高效和无损的数据中心网络来承载发展需求。
以往以HPC(高性能计算)为代表的场景应用多采用Infiniband技术组建高带宽、低延迟的网络。但是随着RoCE技术的应用发展,使以太网在带宽、延迟方面的表现日益趋同,在性价比和发展前景上也更具优势。浪潮网络紧跟市场发展需求,以支持RoCE技术的数据中心以太网交换机为核心,推出了典型的无损以太网解决方案,其具备如下优势:
计算、存储、网络、AIStation无缝融合
通过提供统一品牌的计算、存储、网络和人工智能开发平台整体解决方案,浪潮网络可以支持PFC、ECN等网络流控技术,以构建端到端、无损、低延时的RDMA(远程直接内存访问)承载网络。而交换机完美的缓存优势,可平滑吸收突发流量,有效应对TCP incast。
此外,方案具备智能缓存管理技术(近似公平丢弃、动态报文优先级),可保护短报文的作业管理流量,确保AI集群的运行效率。并支持Telemetry技术,可以提供实时网络数据和设备状态的可视化管理。同时支持RoCE-SAN业务域,RoCE网络灵活接入,AI集群主机与交换机可以同时实现单归、双归连接。浪潮AIStation可以提供统一的主流深度学习框架(Tensorflow、Pytorch、Caffe、Mxnet、PaddlePaddle),开发训练平台以及计算资源(CPU、GPU、内存、存储)管理平台。
故障主动发现、自动倒换
RoCE-SAN网络与存储业务协同、故障快速感知,交换机快速检测到故障状态,并通知给相关业务域内订阅通知消息的服务器,以便业务快速切换到冗余路径,降低对业务的影响。针对大型无损以太网环境下PFC死锁的问题,可以提供芯片级防PFC死锁机制,实现自动检测PFC死锁及恢复。
存储即插即用
RoCE-SAN网络能够自动发现设备服务器与存储设备的接入,并通知服务器自动建立与存储设备的连接关系。
目前,浪潮网络基于RoCE的无损以太网解决方案已在南京智能计算中心等项目中得以应用,无损以太网解决方案可充分发挥浪潮整体解决方案能力的优势,满足通用计算集群、GPU加速集群、异构计算集群、分布式存储集群、全闪存存储集群等场景网络的高速、低延迟连接需求。未来,浪潮网络将继续秉承以客户为中心的发展理念,携手合作伙伴打造更多结合行业场景的网络优秀实践,为加速企业数字化转型做出贡献。
好文章,需要你的鼓励
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。