在模型选择方面——每年工业界与学术界都会提出大量的模型,不同模型有什么优势,什么样的模型适合自己,厂商在挑选合适的模型上存在挑战。
在模型训练方面——大多数模型更侧重于算法的实现,关注易用性和模型的精度,往往忽略了模型吞吐,没有实现生产环境下的训练加速最优,GPU利用率也很低。
这导致了车厂的研发容易成本居高不下,模型落地周期越长,车辆也无法及时获得最新的AI能力。
针对这两大难题,百度智能云联合NVIDIA,根据双方在自动驾驶行业丰富的实践经验,首批精选了17个模型,包括了2D、3D摄像头、雷达等多种传感设备,为车辆提供覆盖自适应巡航、碰撞检测、紧急制动、交通信号灯检车、车道偏离识别、环绕视图、盲点探索、后方碰撞警告等能力。
在模型优化方面,百度智能云技术团队联合 NVIDIA,针对常见智驾场景的感知模型,从数据 I/O 开销、模型计算开销、损失函数计算开销、优化器开销、分布式通信开销等角度进行全面深入分析,结合硬件集群和模型结构等因素,在 GPU 卡上联合 NVIDIA 进行了软硬一体优化,让算法与GPU配合更加默契,最终模型优化实现了平均138%,最高400%的吞吐量提升。
汽车厂商可以直接使用这些模型加速训练,将获得的最新AI能力同步至车辆。现在已经有客户开始将这些优化后的模型投入到业务流程中。
在优化的过程中,百度智能云技术团队不断尝试各种手段来提高模型吞吐量和资源的利用率。比如,在CenterPoint的模型优化中吞吐效果经历了从50%、到169%,再到391%的提升,最终实现了目前400%的吞吐提升,训练时间缩短80%。
在模型优化的过程中,百度智能云联合NVIDIA提炼出了一套通用的模型优化方法论,可以帮助团队在短时间内完成新模型的优化工作。
NVIDIA 开发与技术部总经理李曦鹏说:“汽车智能化刚刚开始,如何构建自动驾驶端到端的模型生产和上线迭代的闭环能力,将成为自驾领域客户的核心竞争力之一。NVIDIA 和百度智能云针对自驾常用的17个模型做的极致优化,加速自动驾驶汽车的研发和商用。为了满足更多模型的需求,相关训练加速的技术手段也会集成到百度百舸的AI加速套件中。”
百度副总裁谢广军表示:“云智一体,深入产业”,模型训练是自动驾驶领域的核心场景。百度智能云联合 NVIDIA 对17个感知模型的训练进行了优化,最高可达到400%的训练吞吐提升,缩短80%的训练时间。双方沉淀的优化方法还将帮助更多行业提升模型训练效率,加速产业智能化升级。”
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。