最新文章

ByteDance的双模型机器人导航系统:让移动机器人像人一样聪明地到处走动

ByteDance Seed团队开发了名为Astra的革命性双模型机器人导航系统,让机器人具备类似人类的环境理解和导航能力。该系统包含Astra-Global和Astra-Local两个模块,前者负责理解自然语言指令和全局定位,后者处理局部路径规划和避障。通过创新的混合拓扑-语义地图、4D时空编码器和掩码ESDF损失等技术,系统在仓库、办公楼等复杂环境中实现了84%-99%的高成功率,显著超越传统方法,为智能机器人助手的实现奠定了重要基础。

UC伯克利大学突破性发现:让AI"眼睛"更清晰的神奇方法,无需重新训练!

UC伯克利大学突破性发现:让AI"眼睛"更清晰的神奇方法,无需重新训练!

UC伯克利研究团队发现了一种革命性方法,能够在不重新训练的情况下修复AI视觉系统的注意力异常问题。他们识别出少数"寄存器神经元"是造成注意力噪点的根源,并开发出"测试时寄存器"技术,将这些异常重定向到专门区域。该方法在多项视觉任务中表现出色,性能媲美专门训练的系统,同时还能抵御印刷攻击,为AI视觉技术的实际应用提供了简单高效的改进方案。

北京大学团队推出ReLIFT:当AI遇到"最难题"时的聪明学习法

北京大学团队推出ReLIFT:当AI遇到"最难题"时的聪明学习法

北京大学团队提出ReLIFT方法,巧妙结合强化学习与监督学习优势。该方法让AI在常规训练中自主练习,遇到最难题目时自动获取高质量指导。实验显示ReLIFT在五个数学竞赛测试中平均提升5.2分,仅需传统方法13%的教学数据,生成答案长度减少近10倍,为AI突破能力边界提供新路径。

波兰研究团队揭秘:为什么聪明的AI大模型会被几个错别字轻松"骗倒"?

波兰研究团队揭秘:为什么聪明的AI大模型会被几个错别字轻松"骗倒"?

波兰研究团队发现,即使是最先进的AI大模型在处理波兰语等非主流语言时也极其脆弱,仅通过几个拼写错误或字符替换就能让AI做出错误判断。研究团队开发了一套巧妙的测试框架,使用小型代理模型找出关键词汇,然后对这些词汇进行十种不同的"伪装攻击"。实验结果显示,这些简单攻击能让先进AI模型的错误率飙升至48%以上,揭示了当前AI技术在多语言安全方面的严重漏洞。

斯坦福大学、Meta和密歇根大学联合揭晓:流媒体视频里的AI助手能边看边聊,还会主动出招帮你完成任务

斯坦福大学、Meta和密歇根大学联合揭晓:流媒体视频里的AI助手能边看边聊,还会主动出招帮你完成任务

这项由斯坦福大学、Meta公司和密歇根大学联合完成的研究,开发了能够实时观看视频并主动提供任务指导的AI助手系统。研究团队创建了包含30万对话的PROASSIST数据集,设计了创新的评估方法,并开发了能处理流媒体视频的端到端模型。实验显示,该系统能够在烹饪、组装等多种任务中提供及时准确的指导,为开发真正智能的人工助手奠定了基础。

Multiverse Computing获2.15亿美元融资,推进量子启发AI模型压缩技术

Multiverse Computing获2.15亿美元融资,推进量子启发AI模型压缩技术

Multiverse Computing宣布完成2.15亿美元B轮融资,用于加速部署其量子计算启发的AI模型压缩技术。该技术可将大语言模型体积缩小95%而不影响性能表现,大幅降低AI推理成本。公司的CompatifAI技术采用量子启发算法和先进张量网络,能识别并剔除AI模型中的冗余部分。压缩后的模型运行速度提升4-12倍,推理成本降低50%-80%,可在云端、本地数据中心甚至边缘设备上运行。

Databricks全面发力企业AI:推出智能代理与数据库解决方案应对复杂性挑战

Databricks全面发力企业AI:推出智能代理与数据库解决方案应对复杂性挑战

Databricks联合创始人兼CEO Ali Ghodsi在Data+AI Summit上宣布了多个新产品,如Agent Bricks和Lakebase,旨在简化企业AI应用开发、降低高成本及解决数据平台锁定问题。

苹果最新研究挑战 AI 模型是否真正通过问题进行 "推理"

苹果最新研究挑战 AI 模型是否真正通过问题进行 "推理"

苹果研究表明,模拟推理模型在高难度问题上多依赖模式匹配而非真正推理,这与 USAMO 最新发现不谋而合。

AI 的重大互操作性转折点:为何 A2A 和 MCP 对代理协作至关重要

AI 的重大互操作性转折点:为何 A2A 和 MCP 对代理协作至关重要

本文论述了AI代理协作的发展趋势。类似于早期REST和JSON推动API革命,A2A和MCP两项协议简化了不同代理间任务共享与信息交换,为企业级智能应用提供了坚实基础。

OpenAI宣布o3价格下调80%,其最强推理大语言模型更易获取

OpenAI宣布o3价格下调80%,其最强推理大语言模型更易获取

OpenAI将旗舰推理大语言模型o3输入和输出token的费用分别下调80%,助力开发者降低成本,并在竞争中抢占优势。

Databricks 开源声明式 ETL 框架,实现流程构建加速90%

Databricks 开源声明式 ETL 框架,实现流程构建加速90%

Databricks 开源了其核心声明式 ETL 框架——Apache Spark Declarative Pipelines(原 Delta Live Tables),简化了批量和流式数据处理,显著缩短开发和维护时间,并将这一技术普惠于整个 Apache Spark 社区,同时向 Snowflake 发起挑战,提供从数据源到可用信息的全流程处理能力。

微软支持的 Mistral 推出欧洲 AI 云,以对抗 AWS 和 Azure

微软支持的 Mistral 推出欧洲 AI 云,以对抗 AWS 和 Azure

法国 AI 新创企业 Mistral AI 携手 Nvidia 推出 Mistral Compute 全链路 AI 基础设施平台,并发布 Magistral 系列推理模型,助力欧洲实现技术自主与可持续发展。

Meta推出超现实AI视频编辑器

Meta推出超现实AI视频编辑器

Meta推出具备电影级特效的AI视频编辑器,利用Movie Gen技术预设多种风格与场景,实现快速转换,助力用户轻松获得专业水平效果。

为什么预制混凝土适合数据中心建设

为什么预制混凝土适合数据中心建设

美国数据中心数量全球领先,市场需求持续攀升。本文阐述预制混凝土如何优化设计、加速施工,提高耐久性与可持续性,有效降低风险,从而促使数据中心更快投运。

星巴克酿制 AI 助力咖啡师而非取代他们

星巴克酿制 AI 助力咖啡师而非取代他们

Starbucks 宣布推出“Green Dot Assist” AI 工具,通过 iPad 帮助咖啡师查找饮品配方、排查设备故障和优化排班,旨在提升门店运营效率并节省员工时间。

Oracle 获得云客户订单——可能是中国的 TEMU——要求随时随地提供任何可用服务器

Oracle 获得云客户订单——可能是中国的 TEMU——要求随时随地提供任何可用服务器

Oracle 凭借云服务需求激增实现营收超预期增长,主要由非 AI 云服务需求推动。该公司 2025 年第四季度营收达 159 亿美元,同比增长 11%,云基础设施服务表现突出,营收 30 亿美元,增长 50%。Oracle 董事长拉里·埃里森表示,最近收到一笔前所未有的订单,客户要求获得所有可用容量,无论位于何处。

GTC 巴黎|黄仁勋交出一份新工业革命的完整“蓝图”
2025-06-12

GTC 巴黎|黄仁勋交出一份新工业革命的完整“蓝图”

黄仁勋在巴黎GTC上,描绘出一副由AI工厂驱动新工业革命的完整“蓝图”。

F5深化与Red Hat战略合作 ,赋能企业AI规模化安全部署
2025-06-12

F5深化与Red Hat战略合作 ,赋能企业AI规模化安全部署

该解决方案聚焦解决企业AI落地核心难题——实现跨环境安全模型部署、数据移动可伸缩性及实时推理能力

Microsoft 推出 Windows 11 开始菜单更新

Microsoft 推出 Windows 11 开始菜单更新

微软在 Dev 频道向 Windows 测试者推出了一系列 Windows 11 开始菜单更新,这包括应用分类和网格视图、新的分组方式以及自适应列显示功能;另外,移动设备内容的折叠扩展功能将在多数市场上线,而欧洲经济区用户则需等待到 2025 年。

分叉出的 Xlibre 火力全开抨击 Wayland 显示协议中的 DEI 策略

分叉出的 Xlibre 火力全开抨击 Wayland 显示协议中的 DEI 策略

Xlibre Xserver 是 X.org 的分支项目,旨在提升安全、性能和无障碍支持,并猛烈抨击 Wayland 中的 DEI 政策,引发行业争议。