随着以ChatGPT为代表的生成式AI应用快速破圈,各行各业期待着技术突破带来的新商业场景落地。如何大规模、低成本、高效率和高质量地释放AI生产力成为产业关注的焦点。为加速AI工程化进度,推动AI从“可用”变为“易用”,中国信息通信研究院联合数十家企业制定了MLOps(机器学习流水线)系列标准,旨在指导产业提升AI工程化水平,加速人工智能的产业落地。
近期,中国信通院首次公布了MLOps服务能力旗舰级评测结果,百度智能云成为全国首批在AI开发管理能力上达到旗舰级的MLOps平台。这代表着,百度智能云AI中台在AI开发的服务能力和管理能力均达到国内领先水平。百度相关负责人表示,后续将为文心一言快速产业化落地提供全方位的支持,面向企业提供一系列AI开发和运维工具。
通过信通院MLOps评测,将为企业提供AI模型开发宝典
AI模型开发运营全流程是个多环节、复杂程度高的工作,从数据采集、数据标注、模型训练再到数据回流和模型观察,任何一个环节未能规范都将影响AI模型的效果。正因如此,目前产业内面临AI模型开发运营流程不规范、自动化程度不高、标准不一致等一系列痛点。在此背景下,信通院牵头制定了《人工智能研发运营一体化(Model/MLOps)能力成熟度模型》标准体系,旨在指导企业提高AI研发运营管理能力,推动AI规模化产业应用,促进企业智能化转型。
不久前,百度智能云AI中台参与了信通院组织的面向产品方的MLOps开发管理服务能力评测,在需求管理、数据工程和模型开发三个模块均达到了旗舰级水平。这是行业对百度AI中台在AI模型工程化应用方面的领先实力的认可,也意味着,企业可以通过百度AI中台获得AI模型开发全流程的最佳实践,降低AI开发的技术门槛和成本,加速智能化转型进程。具体而言,百度智能云将为企业解决两大难题:
第一,大幅降低企业AI开发门槛。百度AI中台提供高自动化水平的模型开发工具和标准化的流程规范指导,AI模型开发不再单纯依赖技术研发人员的个人水平,对开发技术门槛和人才要求都有所降低,从而帮助企业节省成本。
第二,大幅提升AI模型开发质量,因为有了规范和标准,AI模型开发有据可依,企业可通过参考最佳实践,保证AI模型开发的质量。
百度智能云构建新一代AI基础设施,全面加速产业智能化升级
百度智能云之所以率先通过信通院MLOps服务能力旗舰级评测,其根本原因在于,在百度AI中台背后,是集百度AI能力之大成的AI大底座,面向企业AI开发提供端到端的解决方案。
百度AI大底座是国内首个全栈自研的AI基础设施,其形成了一套“芯片-框架-大模型-行业应用”的智能化闭环路径,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,可以实现端到端优化,帮助企业降本增效。基于AI大底座的全栈能力,企业在接入文心一言后,也可低门槛、便捷地完成与业务场景的适配与二次开发,顺利突破AI产业落地的“最后一公里”。
(百度AI大底座架构图)
随着生成式AI等人工智能技术的爆发,产业对完善的AI基础设施的需求日益迫切。百度集团执行副总裁、百度智能云事业群总裁沈抖认为,在AI原生时代,需要云计算厂商标准化地输出智能化的底层能力,把芯片、大模型、深度学习框架等高门槛的技术,变成像水电能一样供客户按需取用。基于百度AI大底座,百度智能云将把AI技术更低成本、更便捷地提供给企业,助力企业加速数智化转型,同时文心一言也将通过百度智能云对外提供服务,为产业带来真正的AI普惠。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
Google DeepMind团队发布了EmbeddingGemma,这是一个仅有3.08亿参数的轻量级文本理解模型,却能达到7亿参数模型的性能水平。该模型在权威的多语言文本嵌入基准测试中排名第一,支持250多种语言,特别适合移动设备部署。研究团队通过创新的编码器-解码器初始化、三重损失函数训练和模型融合技术,实现了性能与效率的完美平衡,为AI技术普及化开辟了新路径。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
日本奈良先端科学技术大学等机构首次深入研究AI编程工具Claude Code在真实开源项目中的表现。通过分析567个代码贡献,发现83.8%被成功接受,54.9%无需修改直接使用。AI擅长重构、测试和文档工作,但需要人工修正bug处理、代码风格等问题。研究揭示了AI编程工具的实际能力边界和改进方向。