当前,信创产业生态正与各个行业深度融合,国家推出“新基建”“东数西算”等多项政策鼓励相关产业发展。在信创产业生态中,云原生技术应用引起持续关注。其中,容器技术凭借着降本增效、易于开发、可提高持续交付能力等优势,能帮助千行百业从积极拥抱云计算向更为精准的云原生应用方向演进。目前在信创产业生态中,不少开发者团队认为容器云等云原生技术能显著提升业务敏捷度和开发效率、降低成本、支撑大流量高并发场景、提升资源使用效率。这说明,信创产业生态的蓬勃发展呼唤优质的云原生容器云技术和产品。
基于以上优势,整个产业正在展开实践尝试,积极推动私有云在各个场景中的应用,云计算开始从消费互联网驱动转向由产业互联网驱动,上云的主力军已经从中小企业、互联网行业快速渗透到传统大中型企业,例如政府、电信、金融、交通、能源、教育、医疗、制造等行业已经成为私有云的主要应用领域,根据计世资讯统计,政府和金融行业在私有云市场共占比接近50%,所以我们将会面对的是有私有云容器诉求的大量信创行业客户。以容器为代表的云原生技术将是发展信创产业不可或缺的重要技术。以自主软硬件为支撑的容器云作为承载企业数字化系统的核心平台,正迎来发展的黄金时期。
而目前市面上缺少成熟、易用的信创行业容器云平台产品,特别缺少完美支持基于鲲鹏、飞腾等国产CPU架构的容器云平台。部分已有的信创容器云平台产品由于发展时日较短,依然存在功能不完全,使用不流畅等问题,而已有的部分成熟开源产品则存在适配不深入,使用不兼容的问题,整个信创容器云市场就是一片未经开发的宝藏之地。
神州数码从自身云原生技术积累以及对信创产业生态的深厚理解出发,基于Rancher开源技术平台,开启Rancher ARM64发行版开发适配工作,实现了Rancher ARM64发行版和Rancher X86发行版完全一致的功能和用户体验。积极推动优质开源平台与底层国产基础软硬件的适配落地,打造云及数字化底座,在异构算力架构下获得弹性云算力支撑。
该平台为信创用户提供企业级Kubernetes平台管理能力,实现应用全生命周期管理,支撑业务系统快速上线;平台提供了容器runtime、网络、存储、负载均衡、镜像仓库、多云异构集群管理、运维管理和运营管理、持续集成和持续发布、微服务治理等多种能力,能显著简化客户业务上云后管理的复杂性。
神州数码容器云平台产品海纳百川,实现ARM64和X86架构的混合一体化部署,极大扩展了使用场景,单纯的X86和ARM架构以及混合异构算力平台都能胜任。平台开发了一键自动化部署工具,大大简化安装过程中繁琐的步骤,降低了易错的风险;对核心模块进行调优,使得用户可以在30分钟内完成整个云平台以及所有的核心模块的安装,做到了真正的开箱即用。采用智能网卡技术,大大提升容器网络性能并极大增强了Kubernetes容器网络的安全性、可运维性、管理性和性能,为Kubernetes生态的落地带来了独特的价值。针对信创软硬件环境,进行大量的适配调优工作,支持信创产业生态中主流的软硬件产品,显著提升容器云平台在信创架构中的使用体验
这也是信创产业中,对容器云技术适配研发的创新实践,神州数码打造的Rancher ARM64发行版容器云平台不仅能推动优质的开源平台在ARM64国产化信创领域的生产环境落地,也将帮助信创产业客户更好进行数字化转型。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。