[中国,深圳,2022 年 11 月 9 日] 华为全联接大会 2022 在深圳线下和线上同步举办。大会期间,中国科学技术信息研究所党委书记、所长、科技部新一代人工智能发展研究中心主任,赵志耘发表了题为《以大模型地图,统筹大模型有序发展》主题演讲,分享了中国大模型的最新进展和发展方向,建议统筹规划大模型发展布局,汇聚大模型发展要素,加强发展人工智能计算中心和算力网络,以产业联合体探索大模型落地新模式,加快推动大模型落地,赋能产业发展。

当前人工智能技术正朝着通用大模型方向发展,大模型具备更强泛化能力、可覆盖多业务场景,发展大模型也成为产学研各界共识。为了更好支持大模型发展,华为与产业界一起构建了从规划、开发到产业化的大模型全流程使能体系,共筑中国大模型生态。
华为计算产品线总裁邓泰华在大会的主题演讲中提到,以大算力为基础,人工智能大模型全流程使能体系从规划、开发到产业化落地,支持大模型创新。在开发阶段,基于昇腾的大模型开发使能平台,让大模型更易开发、适配和部署;在产业化阶段,通过遥感、多模态、流体力学等领域的大模型产业联合体,将解决大模型行业应用落地及产业孵化,最终服务于千行百业。
为推动大模型发展,在科技部指导下,中国科学技术信息研究所和产业界共同规划中国人工智能大模型地图,并即将发布《中国人工智能大模型地图研究报告》。

赵志耘表示,大模型地图展示了我国大模型发展现状,同时也揭示了一系列有待解决的挑战性问题,突出表现在三个方面:一是大模型发展要素缺乏统筹;二是大模型开发过程中缺乏协作;三是大模型行业落地困难等。
因此,中国科学技术信息研究所联合相关的研究力量,共同对中国人工智能大模型的发展现状进行了调研,并以可视化形式,从分布、要素、活跃度和应用等方面,揭示中国人工智能大模型的阶段性发展特征,剖析尚存在的问题,为下一步统筹规划大模型发展,积极探索产业赋能,提供有效的方法工具。
大模型地图的规划以及即将发布的《中国人工智能大模型地图研究报告》,将有助于统筹中国大模型有序发展,结合产业联合体等形式探索大模型落地的新方法、新模式,联合打造标杆项目,加快推动大模型切实落地赋能产业发展。
完整版《中国人工智能大模型地图研究报告》将于“2022年中关村论坛” 正式发布。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。