/

阿里云推出单机即可训练百亿参数的中文稀疏GPT大模型，登顶 ZeroCLUE零样本学习榜单

日前，中文语言理解权威评测基准CLUE公布了零样本学习ZeroCLUE的最新结果，阿里云位于该榜单榜首。

作者：同润、临在

日前，中文语言理解权威评测基准CLUE公布了零样本学习ZeroCLUE的最新结果，阿里云位于该榜单榜首。此次刷榜的模型是阿里云机器学习PAI团队推出的160亿参数的稀疏模型 GPT-MoE,这也是业界首个中文稀疏GPT大模型在该榜单登顶。

在继去年的Transformer Encoder大模型取得中文小样本学习、英文预训练模型知识量度量冠军后，今年阿里云将大模型技术能力又向前推进了一步。基于MoE稀疏结构，仅用一台A100就把160亿参数量级的多任务通用GPT模型训练成熟。这是通往低成本且高性能多任务通用自然语言理解的重要里程碑。

中文GPT大模型落地主要面临来自两方面的挑战：一方面是中文语言建模的困难，中文可以利用复杂多变的自由组合表达多重含义，这使得中文语言模型比英文在表达效率上难度加倍；另一方面随着模型参数量的不断增加，需要投入的硬件成本越来越高，训练成熟时间越来越长。

以OpenAI推出的1750亿的GPT-3为例，在1024张A100GPU上预估需要34天；因此，能否消耗更少的计算资源以高性价比的方式完成训练和推理是大模型落地亟待解决的难题。

GPT-MoE 模型采用稀疏模型的结构设计，有效缓解了上面提到的两个困难。在刷榜的过程中，从工程到算法沉淀出4点自研核心技术，有强化型稀疏均衡器，领域话术再适应驱动的中文提示语零样本学习，中文复杂任务定向优化，以及阿里云自主研发的transformer训练加速工具Rapidformer，实现了单机A100即可训练160亿参数大模型。

目前，GPT-MoE 模型已在阿里云机器学习PAI EasyNLP项目中开源，和开发者共享中文百亿稀疏GPT大模型技术。

开源项目地址：https://github.com/alibaba/EasyNLP/tree/master/examples/rapidformer

来源：业界供稿

阿里云

0赞

好文章，需要你的鼓励

推荐文章

数据中心的智算挑战，英特尔要如何应对？

英特尔

人工智能

大模型

2025-09-30

数据中心的智算挑战，英特尔要如何应对？

阿里云第九代企业级ECS实例g9i不到150天服务超2万家客户，现在已有接近3万用户。

Queen‘s大学重磅研究：程序员的角色即将彻底改变，从码农到智能体指挥官

软件工程

智能体编程

人机协作

2025-09-30

Queen‘s大学重磅研究：程序员的角色即将彻底改变，从码农到智能体指挥官

Queen's大学研究团队提出结构化智能体软件工程框架SASE，重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者，建立双向咨询机制和标准化文档系统，解决AI编程中的质量控制难题，为软件工程向智能化协作时代转型提供系统性解决方案。

苹果发布 iOS 26.0.1 系统更新，修复多项关键问题

移动操作系统

系统更新

错误修复

2025-09-30

苹果发布 iOS 26.0.1 系统更新，修复多项关键问题

苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1，建议所有用户安装。由于重大版本发布通常伴随漏洞，许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试，但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布，测试范围此前受限。预计苹果将继续发布后续修复版本。

医疗AI的“显微镜革命“：西北工业大学团队发布首个超声影像专用智能助手EchoVLM

医疗人工智能

视觉语言模型

超声影像诊断

2025-09-30

医疗AI的“显微镜革命“：西北工业大学团队发布首个超声影像专用智能助手EchoVLM

西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM，通过收集15家医院20万病例和147万超声图像，采用专家混合架构，实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题，为医生提供智能辅助，推动医疗AI向专业化发展。

2022

09/02

11:20

分享

点赞

最新文章

相关文章

邮件订阅

AI启示录

更多

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

业界热点:

数字化转型

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号京网文(2025) 0096-033号京字第20868号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　公开举报受理处置规则

网上有害信息举报专区：https://www.12377.cn

安全联盟认证