最新文章
KTH团队推出PRIX:只用摄像头的智能驾驶系统,比激光雷达方案更快更省钱

KTH团队推出PRIX:只用摄像头的智能驾驶系统,比激光雷达方案更快更省钱

瑞典皇家理工学院与斯堪尼亚公司合作开发的PRIX自动驾驶系统,仅使用普通摄像头就达到了业界顶尖性能,处理速度比竞争对手快25%以上。该系统通过创新的视觉特征提取技术和扩散模型规划器,在多项标准测试中表现优异,为低成本自动驾驶技术的普及提供了可行方案,有望大幅降低自动驾驶汽车的制造成本。

企业级智能体AI框架Agntcy正式加入Linux基金会

企业级智能体AI框架Agntcy正式加入Linux基金会

智能体AI有望通过大幅改善工作流自动化来推动企业转型。Agntcy是2025年3月成立的开源组织,致力于构建"智能体互联网"框架。该框架由思科Outshift孵化部门创立,专注于智能体协调编排和身份访问管理。7月29日Linux基金会正式接纳该联盟,为框架提供更稳固的行业基础,新增戴尔、谷歌云、甲骨文云和红帽等重要成员。

飞利浦AI战略:通过智能化实现大规模优质医疗服务

飞利浦AI战略:通过智能化实现大规模优质医疗服务

飞利浦首席创新战略官谢兹·帕托维分享了公司的AI战略。飞利浦采用客户驱动的创新模式,将80%研发资源嵌入业务单元,20%专注行业突破。公司AI战略围绕自动化、增强和敏捷三个维度展开,旨在2030年惠及25亿人。通过SmartSpeed AI等创新,飞利浦在保持人机协作的同时,利用生成式AI提升内部效率,推动医疗行业进入智能化新时代。

Linux内核6.16发布:代码量达3800万行但缺乏重大新特性

Linux内核6.16发布:代码量达3800万行但缺乏重大新特性

Linux内核6.16在周末发布,虽然没有重大新功能,但包含大量错误修复和代码优化。该版本拥有3840万行代码,分布在超过78000个文件中。主要改进包括:支持英特尔2023年高级性能扩展,XFS和ext4文件系统性能优化,NUMA系统自动调优,五级页表支持,以及USB硬件声音解码卸载功能。这些改进展现了Linux在大型服务器到小型设备的广泛应用范围。

高德纳:全球网络安全支出将突破2000亿美元

高德纳:全球网络安全支出将突破2000亿美元

Gartner预测,受高调网络攻击事件不断增加和新兴风险驱动,全球终端用户组织的网络安全产品和服务支出持续上升,2025年将超过2000亿美元。人工智能和生成式AI的广泛应用成为关键增长驱动因素,信息安全总支出将从2024年的1935亿美元增至今年的2130亿美元,同比增长约10%。

Writer发布企业级自主AI"超级智能体"

Writer发布企业级自主AI"超级智能体"

生成式AI初创公司Writer发布Action Agent,这是一款集成工具使用、知识工作和深度研究能力的强大AI智能体,具备企业级控制和透明度。该智能体由Palmyra X5大语言模型驱动,能够执行需要问题解决、复杂推理和多工具使用的大量任务。Action Agent具备自我纠错能力,可处理网页交互、数据分析、文件系统操作和代码编写等多种任务,拥有600多个工具连接器,支持80个企业和第三方数据平台。

Matrice.ai与Voltage Park合作,加速无代码计算机视觉开发

Matrice.ai与Voltage Park合作,加速无代码计算机视觉开发

计算机视觉初创公司Matrice.ai宣布完成种子轮战略扩展融资,云基础设施提供商Voltage Park领投。该公司开发的无代码平台可创建人工智能视觉模型,开发速度比传统方法快40%,成本降低80%。该平台采用数据驱动方法,提供自动化数据集标注工具,无需编程背景即可使用。目前已为数百个企业摄像头提供服务,客户遍及能源、零售和公共部门。

Photoshop推出强大AI工具助力内容创作者

Photoshop推出强大AI工具助力内容创作者

Adobe发布Photoshop全新AI工具套件,包括Harmonize智能融合功能、生成式放大工具和改进的移除工具。Harmonize可自动调整色彩、光线和阴影,实现无缝合成;生成式放大可将图像提升至800万像素而不损失清晰度;改进的移除工具能精准清理图像并生成逼真填充内容。新功能还包括Projects项目管理和双Firefly模型选择器,支持桌面、网页和移动端使用。

Qdrant推出轻量级边缘设备向量数据库

Qdrant推出轻量级边缘设备向量数据库

开源向量数据库公司Qdrant开发了一款轻量级向量数据库,专为机器人、自助终端、移动设备和其他嵌入式系统本地运行而设计。Qdrant Edge支持开发者在边缘设备上本地运行混合和多模态搜索,无需连接服务器进程。该产品提供生命周期完全控制、内存使用优化和进程内执行功能,支持高级过滤和实时代理工作负载兼容性。应用场景包括机器人导航、智能零售终端和隐私优先的移动助手等。

LTO-10为何在速度提升和向后兼容性方面表现不佳

LTO-10为何在速度提升和向后兼容性方面表现不佳

LTO-10磁带相比LTO-9在容量上有所提升,但数据传输速度仍维持在400MBps,且失去了向后兼容性。IBM专家表示,速度限制主要源于物理材料约束,6微米厚的磁带材料在10米/秒最高速度下容易损坏。容量提升主要通过改善磁道密度实现,而非线性密度。LTO-10采用36度伺服格式替代之前的6度格式,并引入磁头倾斜跟踪控制技术,这些变化导致无法兼容LTO-9。未来LTO-11可能采用64磁道磁头,传输速度有望达到1000MBps。

周末加班?熬夜回邮件?AI技术帮你重建工作边界
2025-07-30

周末加班?熬夜回邮件?AI技术帮你重建工作边界

AI赋能「前沿企业」通过智能体协作重构工作模式,破解无边界工作日困局。

人工智能学会了自我纠错:当AI发现自己被"忽悠"时的反击策略

人工智能学会了自我纠错:当AI发现自己被"忽悠"时的反击策略

西班牙研究团队提出了一种创新的AI自我纠错方法SSC,让人工智能学会识别和修正规则中的漏洞。当AI发现自己在钻空子获得高分时,它会反思规则的合理性并主动改进。实验显示这种方法将AI的"钻空子"行为从50-70%降低到3%以下,同时提升了回答质量。这项技术有望让AI从被动执行指令转变为能够质疑和改进指令的智能协作伙伴。

从像素到语义:探索图像分割中的深度学习革命——斯坦福大学与加州大学伯克利分校的突破性研究

从像素到语义:探索图像分割中的深度学习革命——斯坦福大学与加州大学伯克利分校的突破性研究

这篇文章详细解析了Long、Shelhamer和Darrell在2015年CVPR会议上发表的开创性研究"全卷积网络用于语义分割"。文章以通俗易懂的方式,将这项复杂的技术比作艺术家的绘画过程,解释了如何让计算机不仅识别图像中有什么物体,还能精确标出每个物体的位置和边界。研究团队通过将传统分类网络改造为全卷积形式,并巧妙运用上采样和跳跃连接技术,实现了高效准确的像素级图像理解。这一突破为自动驾驶、医学影像和增强现实等领域带来了革命性变化,奠定了现代计算机视觉的重要基础。

多模态AI学习的新突破:慕尼黑大学团队发现AI竟然"视而不见",DARA技术让机器真正学会"看图说话"

多模态AI学习的新突破:慕尼黑大学团队发现AI竟然"视而不见",DARA技术让机器真正学会"看图说话"

慕尼黑大学研究团队发现当前多模态AI存在"视觉盲区"问题,在学习时过度依赖文字而忽视图像信息。他们开发的DARA技术能够动态调节AI的注意力分配,用约100个参数实现10%性能提升,并创建了TrueMICL数据集来准确评估真正的多模态学习能力。该研究为多模态AI的发展指明了新方向。

Iwin Transformer:上海交通大学提出的无位置编码视觉变换器,让AI看图更聪明

Iwin Transformer:上海交通大学提出的无位置编码视觉变换器,让AI看图更聪明

上海交通大学研究团队提出Iwin Transformer,这是一种无位置编码的分层视觉变换器,通过创新的交错窗口注意力和深度可分离卷积协作,能直接从低分辨率微调到高分辨率。该方法用注意力连接远程令牌,用卷积连接邻近令牌,在单模块内实现全局信息交换,克服了Swin Transformer需要两个连续块的局限。在ImageNet-1K上达到87.4%准确率,在语义分割和视频识别等任务中表现出色。

清华大学团队重新定义视频搜索:当几何学遇上人工智能,让机器像人类一样"理解"视频层次

清华大学团队重新定义视频搜索:当几何学遇上人工智能,让机器像人类一样"理解"视频层次

清华大学团队在2025年发表突破性研究,首次将双曲几何学引入视频检索领域,解决了传统系统在处理"部分相关视频检索"时的层次理解问题。通过HLFormer框架的双空间并行处理和创新的部分序保持损失机制,在三个权威数据集上实现显著性能提升,为视频搜索技术开辟了全新发展方向。

阿里巴巴推出GSPO:让AI大模型训练不再"崩盘"的革命性算法

阿里巴巴推出GSPO:让AI大模型训练不再"崩盘"的革命性算法

阿里巴巴通义千问团队推出GSPO算法,解决了大型语言模型强化学习训练中的稳定性问题。该算法改变传统逐词优化方式,采用序列级重要性权重和截断机制,显著提高训练效率和稳定性,特别适用于专家混合模型训练,已成功应用于Qwen3模型并取得显著性能提升。

Sber AI团队突破视频生成瓶颈:让超高清视频制作快2.7倍的神奇算法

Sber AI团队突破视频生成瓶颈:让超高清视频制作快2.7倍的神奇算法

俄罗斯Sber AI团队开发出NABLA算法,通过邻域自适应块级注意力机制实现AI视频生成2.7倍加速。该算法采用三步优化:降维侦察、智能筛选和精确映射,动态识别重要注意力区域,在保持视频质量的同时大幅减少计算开销,为高效AI视频生成提供新解决方案。

蚂蚁集团推出Agentar-Fin-R1:金融AI界的"推理大师"来了!

蚂蚁集团推出Agentar-Fin-R1:金融AI界的"推理大师"来了!

蚂蚁集团研究团队推出Agentar-Fin-R1金融专用AI模型,首次实现了金融专业知识与强推理能力的完美结合。该模型在保持通用推理能力的同时,在金融专业任务上取得突破性表现,并通过创新的三重保险体系确保高风险金融场景下的可靠性和合规性,为金融AI的专业化发展开辟了全新路径。

西安交通大学团队新突破:让AI推理快一倍准一倍的"动量不确定性"方法

西安交通大学团队新突破:让AI推理快一倍准一倍的"动量不确定性"方法

西安交通大学等机构研究团队提出MUR方法,通过"动量不确定性"概念让AI推理系统学会轻重缓急,在节省50%以上计算资源的同时提升0.62-3.37%的准确率。该方法从物理学动量概念获得灵感,能够识别关键推理步骤并选择性地分配计算资源,解决了AI推理中的"过度思考"问题,为提高AI系统效率开辟了新路径。