在模型选择方面——每年工业界与学术界都会提出大量的模型,不同模型有什么优势,什么样的模型适合自己,厂商在挑选合适的模型上存在挑战。
在模型训练方面——大多数模型更侧重于算法的实现,关注易用性和模型的精度,往往忽略了模型吞吐,没有实现生产环境下的训练加速最优,GPU利用率也很低。
这导致了车厂的研发容易成本居高不下,模型落地周期越长,车辆也无法及时获得最新的AI能力。
针对这两大难题,百度智能云联合NVIDIA,根据双方在自动驾驶行业丰富的实践经验,首批精选了17个模型,包括了2D、3D摄像头、雷达等多种传感设备,为车辆提供覆盖自适应巡航、碰撞检测、紧急制动、交通信号灯检车、车道偏离识别、环绕视图、盲点探索、后方碰撞警告等能力。
在模型优化方面,百度智能云技术团队联合 NVIDIA,针对常见智驾场景的感知模型,从数据 I/O 开销、模型计算开销、损失函数计算开销、优化器开销、分布式通信开销等角度进行全面深入分析,结合硬件集群和模型结构等因素,在 GPU 卡上联合 NVIDIA 进行了软硬一体优化,让算法与GPU配合更加默契,最终模型优化实现了平均138%,最高400%的吞吐量提升。
汽车厂商可以直接使用这些模型加速训练,将获得的最新AI能力同步至车辆。现在已经有客户开始将这些优化后的模型投入到业务流程中。
在优化的过程中,百度智能云技术团队不断尝试各种手段来提高模型吞吐量和资源的利用率。比如,在CenterPoint的模型优化中吞吐效果经历了从50%、到169%,再到391%的提升,最终实现了目前400%的吞吐提升,训练时间缩短80%。
在模型优化的过程中,百度智能云联合NVIDIA提炼出了一套通用的模型优化方法论,可以帮助团队在短时间内完成新模型的优化工作。
NVIDIA 开发与技术部总经理李曦鹏说:“汽车智能化刚刚开始,如何构建自动驾驶端到端的模型生产和上线迭代的闭环能力,将成为自驾领域客户的核心竞争力之一。NVIDIA 和百度智能云针对自驾常用的17个模型做的极致优化,加速自动驾驶汽车的研发和商用。为了满足更多模型的需求,相关训练加速的技术手段也会集成到百度百舸的AI加速套件中。”
百度副总裁谢广军表示:“云智一体,深入产业”,模型训练是自动驾驶领域的核心场景。百度智能云联合 NVIDIA 对17个感知模型的训练进行了优化,最高可达到400%的训练吞吐提升,缩短80%的训练时间。双方沉淀的优化方法还将帮助更多行业提升模型训练效率,加速产业智能化升级。”
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。