多所顶级机构联合审查152篇论文发现,地理空间基础模型领域存在测试标准混乱、数据不公开、结果无法比较等系统性问题,并提出六条改进建议。
本研究提出HarnessAudit框架,通过审计AI智能体的完整执行轨迹而非最终输出,发现任务完成与安全合规存在系统性矛盾,资源访问和多智能体信息流是最主要的违规集中区。
红帽AI与MIT-IBM团队提出SNLP框架,将Transformer层间依赖转化为方程组并行求解,配合SNLP感知训练,实现最高2.3倍加速同时降低困惑度。
Spotify推出独立AI应用Studio,可根据用户的收听历史、邮件、日历等数据,每日自动生成个性化简报、播客和歌单。该应用支持聊天提示操作,生成内容可保存至Spotify资料库,将面向18岁以上用户开放研究预览。此外,Spotify还推出播客聊天机器人及个人播客功能。谷歌、亚马逊、微软等科技巨头也已布局AI播客领域。
澳大利亚建筑机器人公司August Robotics宣布完成3000万美元新一轮融资,由Big Pi Ventures领投,Blackbird、Skip Capital等现有投资方及美国建筑专业机构GS Futures跟投。公司将利用该资金加速推进软件协同机器人平台的落地应用,重点覆盖超大规模数据中心等建筑场景。其钻孔机器人可自动读取施工坐标、精准打孔,大幅压缩工期,已在美国和欧洲多个超大规模建筑项目中完成部署。
在新加坡ATxSummit科技峰会上,业界领袖指出,尽管机器人形态的具身AI因硬件、仿真与传感器技术进步而能力显著提升,但更广泛的落地应用仍依赖于可靠性、安全性、成本、数据可用性及更完善的治理标准。英伟达首席科学家Dally强调,下一突破在于让机器人执行未经明确编程的任务。东京大学教授松尾豊提醒,该行业仍处于早期阶段,架构、算法、数据与安全系统均需持续完善。
ModelCat宣布入选2026年亚马逊设备气候科技加速器,该项目由亚马逊与Plug and Play技术中心联合开展,旨在支持能降低消费设备碳排放的创新技术。本届共15家企业入选,涵盖可持续电池、低碳材料、半导体创新等领域。ModelCat将探索边缘AI如何降低消费设备能耗与碳足迹,通过在设备端直接运行AI推理,减少对云端处理的依赖,提升能效并支持规模化部署。
谷歌在I/O 2026大会上宣布推出"Gemini built in"方案,将AI功能扩展至第三方摄像头、扬声器等设备。该计划为第三方品牌提供一站式解决方案,包含构建Gemini硬件所需的参考设计。沃尔玛旗下Onn品牌或成首批合作伙伴之一,搭载Gemini的智能扬声器近期已有泄露消息。此外,谷歌还向开发者开放智能家居核心功能,并支持运营商将Google Home Premium集成至自家服务中。
Spotify在"投资者日"活动上发布了实验性桌面应用"Studio",该应用可获取用户授权后,整合收听习惯、日历、邮件、笔记等个人数据,通过AI生成个性化播客节目。用户可自定义提示词,让AI生成每日简报、邮件摘要或公路旅行歌单等内容。这一功能与谷歌NotebookLM的Audio Overviews类似,但Spotify可主动抓取外部信息。该功能将在未来数周内向20余个地区18岁以上用户开放测试。
联想Legion Y900系列正式在中国发布,提供11.1英寸和13英寸两款游戏平板。两款产品均搭载3840×2560分辨率144Hz高刷屏,分别配备联发科天玑9500S和骁龙8 Gen 5芯片,支持可拆卸键盘,电池容量分别达11000mAh和12700mAh。售价约合人民币3200元至4000元,目前暂无全球发售计划。此外,联想还同步推出Legion Y70游戏手机,搭载骁龙8 Gen 5及6.8英寸屏幕。
Raster2Seq是康奈尔大学提出的平面图重建方法,将光栅化建筑图像自动转换为含语义标注的矢量多边形序列,在多个基准上达到最优水平。
近期,部分YouTube TV用户反映在浏览直播指南时遭遇播放中断问题。该故障主要影响Roku流媒体设备及部分智能电视用户,表现为打开直播指南菜单时视频流中断,屏幕变为灰色,且切换频道需要额外等待数秒。正常情况下,直播内容应在指南菜单开启时持续播放。有用户表示此问题已持续约一年,涉及TCL、海信等品牌Roku电视及Roku Ultra设备。目前谷歌尚未就修复方案作出回应。
Bare Bones旗下经典文本与代码编辑器BBEdit迎来16版本更新,带来多项重磅新功能:支持在图片内直接搜索文字(含grep模式匹配)、深度集成macOS Shortcuts自动化、Notebooks笔记本过滤与索引加速、流式AI工作表响应、SFTP传输速度大幅提升,以及HTML语法检查器升级等。新版定价不变,BBEdit 15用户升级价为30美元。
Perplexity旗下Comet AI浏览器的iOS版本近日发布重大更新,带来8项核心改进。Comet最初于去年7月登陆Mac平台,今年3月正式移植至iPhone和iPad,4月又针对iPad版本优化了多任务支持。此次更新不仅涵盖多项新功能,还修复了清除数据和关闭标签页时的崩溃问题,改善了图标显示稳定性,并优化了iPhone底部控件的界面布局。
电网软件平台Texture宣布完成1250万美元A轮融资,由VoLo Earth Ventures和Equal Ventures联合领投。该平台为电力公司提供统一的设备与数据视图,支持实时监控、变压器负载追踪及分布式能源协调。目前已服务于多家电力合作社,可在数天内完成部署,无需替换现有系统。本轮融资将用于团队扩张和平台升级,总融资额累计约2300万美元。
这项研究推出PROOFGRID基准,通过要求AI模型书写机器可验证的完整逻辑证明来测试推理能力,揭示了顶级模型普遍存在的"会想不会写"、认知前后矛盾及过度自信等深层问题。
AuralSAM2为SAM2添加声音感知能力,通过外挂AuralFuser模块和金字塔式音频提示注入,在不降低交互效率的前提下显著提升音视频目标分割准确率。
山雀如何用"晶体大脑"记住上千个藏粮地点?研究发现记忆容量差异源于神经活动的几何相变,与神经元数量无关,晶体代码比雾气代码的记忆容量高出逾百倍。
牛津大学研究发现,网站只需通过植入JavaScript代码,被动观察AI助手的点击节奏与按键习惯,即可以高达96%的准确率识别其背后的大模型身份,揭示了AI浏览行为中一个此前未被记录的安全漏洞。