在模型选择方面——每年工业界与学术界都会提出大量的模型,不同模型有什么优势,什么样的模型适合自己,厂商在挑选合适的模型上存在挑战。
在模型训练方面——大多数模型更侧重于算法的实现,关注易用性和模型的精度,往往忽略了模型吞吐,没有实现生产环境下的训练加速最优,GPU利用率也很低。
这导致了车厂的研发容易成本居高不下,模型落地周期越长,车辆也无法及时获得最新的AI能力。
针对这两大难题,百度智能云联合NVIDIA,根据双方在自动驾驶行业丰富的实践经验,首批精选了17个模型,包括了2D、3D摄像头、雷达等多种传感设备,为车辆提供覆盖自适应巡航、碰撞检测、紧急制动、交通信号灯检车、车道偏离识别、环绕视图、盲点探索、后方碰撞警告等能力。
在模型优化方面,百度智能云技术团队联合 NVIDIA,针对常见智驾场景的感知模型,从数据 I/O 开销、模型计算开销、损失函数计算开销、优化器开销、分布式通信开销等角度进行全面深入分析,结合硬件集群和模型结构等因素,在 GPU 卡上联合 NVIDIA 进行了软硬一体优化,让算法与GPU配合更加默契,最终模型优化实现了平均138%,最高400%的吞吐量提升。
汽车厂商可以直接使用这些模型加速训练,将获得的最新AI能力同步至车辆。现在已经有客户开始将这些优化后的模型投入到业务流程中。
在优化的过程中,百度智能云技术团队不断尝试各种手段来提高模型吞吐量和资源的利用率。比如,在CenterPoint的模型优化中吞吐效果经历了从50%、到169%,再到391%的提升,最终实现了目前400%的吞吐提升,训练时间缩短80%。
在模型优化的过程中,百度智能云联合NVIDIA提炼出了一套通用的模型优化方法论,可以帮助团队在短时间内完成新模型的优化工作。
NVIDIA 开发与技术部总经理李曦鹏说:“汽车智能化刚刚开始,如何构建自动驾驶端到端的模型生产和上线迭代的闭环能力,将成为自驾领域客户的核心竞争力之一。NVIDIA 和百度智能云针对自驾常用的17个模型做的极致优化,加速自动驾驶汽车的研发和商用。为了满足更多模型的需求,相关训练加速的技术手段也会集成到百度百舸的AI加速套件中。”
百度副总裁谢广军表示:“云智一体,深入产业”,模型训练是自动驾驶领域的核心场景。百度智能云联合 NVIDIA 对17个感知模型的训练进行了优化,最高可达到400%的训练吞吐提升,缩短80%的训练时间。双方沉淀的优化方法还将帮助更多行业提升模型训练效率,加速产业智能化升级。”
好文章,需要你的鼓励
苹果在iOS 26中推出全新游戏应用,为iPhone、iPad和Mac用户提供个性化的游戏中心。该应用包含五个主要版块:主页展示最近游戏和推荐内容,Arcade专区提供超过200款无广告游戏,好友功能显示Game Center动态并支持游戏挑战,资料库可浏览已安装游戏并提供筛选选项,搜索功能支持按类别浏览。iOS 26.2版本还增加了游戏手柄导航支持,为游戏玩家提供更便捷的操作体验。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
睡眠耳塞制造商Ozlo正将其产品转型为数据平台。公司与冥想应用Calm建立合作,利用SDK分享睡眠传感器数据,帮助内容创作者了解用户真实反馈。Ozlo计划推出AI睡眠助手、耳鸣治疗订阅服务和床边音箱等新产品,并收购了脑电图技术公司Segotia,预计2027年推出脑电监测产品进军医疗设备市场,目前正在进行B轮融资。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。