最新文章
IT自动化真实ROI,顶级CIO们如何衡量?

IT自动化真实ROI,顶级CIO们如何衡量?

本文整理自一场关于IT自动化的主题演讲。Surescripts业务技术解决方案与运营副总裁Rachel Lockett和TeamDynamix首席产品官Andrew Graf,分享了如何识别最具价值的自动化工作流、克服实施障碍,并建立ROI衡量框架。无论企业处于自动化旅程的哪个阶段,均可从中获取推动2026年及未来卓越运营的实用指导。

AI大脑里藏着"知道但不做"的秘密——马里兰大学揭示大语言模型工具调用的认知执行鸿沟

AI大脑里藏着"知道但不做"的秘密——马里兰大学揭示大语言模型工具调用的认知执行鸿沟

研究发现大语言模型工具调用存在严重的知行脱节:模型内部已形成正确的工具需求认知,但在实际行动中却无法可靠转化,决策失误率高达54%。

谷歌DeepMind让AI看懂长视频的速度快了35%,秘诀竟是换一双"更聪明的眼睛"

谷歌DeepMind让AI看懂长视频的速度快了35%,秘诀竟是换一双"更聪明的眼睛"

谷歌DeepMind提出LiteFrame,通过压缩令牌蒸馏训练轻量视觉编码器,在处理8倍更多视频帧的同时将端到端延迟降低35%,准确率同步提升。

首尔大学研究团队让"扩散模型"找到了进入语言模型的正确门——他们是怎么做到的?

首尔大学研究团队让"扩散模型"找到了进入语言模型的正确门——他们是怎么做到的?

首尔大学研究团队提出DiHAL,通过几何代理指标找到预训练Transformer最适合植入扩散模块的内部层,将连续扩散从词嵌入迁移至隐藏状态重建,改善了扩散语言模型的生成质量。

AMD研究团队打造"GPU内核优化竞技场":AI编程助手到底能把芯片跑多快?

AMD研究团队打造"GPU内核优化竞技场":AI编程助手到底能把芯片跑多快?

AMD研究团队构建了包含196个GPU内核优化任务的开源评测平台AgentKernelArena,首次系统测试了AI编程代理的优化能力与泛化可靠性,发现代理在已见配置上加速可达6.89倍,但在未见输入形状上正确率可骤降40%。

南开大学与百度联合研究:用"短文本"训练AI读"超长文章",效果竟比正规训练还好?

南开大学与百度联合研究:用"短文本"训练AI读"超长文章",效果竟比正规训练还好?

南开大学与百度联合提出EndPrompt方法,通过在短文本末尾附加带有远端位置编号的提示词,无需完整长序列训练即可将AI上下文窗口从8K扩展至64K,性能超越多种传统方法。

清华大学等机构研究:给机器人装上"真正懂物理"的数字眼睛,WorldString如何让AI理解万物皆可动?

清华大学等机构研究:给机器人装上"真正懂物理"的数字眼睛,WorldString如何让AI理解万物皆可动?

清华大学等机构提出WorldString,一种统一的神经网络架构,可同时建模关节、蒙皮和软体三类可动物体的三维形态变化,直接从RGB-D视频学习。

蚂蚁集团联合多所高校:一个3B小模型凭什么在空间任务上把GPT-5压着打?

蚂蚁集团联合多所高校:一个3B小模型凭什么在空间任务上把GPT-5压着打?

蚂蚁集团等机构提出AtlasVA框架,用空间热力图替代文字存储AI记忆,让3B小模型无需外部教师监督即可在空间推理任务上超越GPT-5,平均成功率达0.93。

百度、上海交大等多机构联合研究:大模型里藏着一个"数值炸弹",你的AI量化部署或许正在悄悄失准

百度、上海交大等多机构联合研究:大模型里藏着一个"数值炸弹",你的AI量化部署或许正在悄悄失准

这项研究系统测量了27个主流开源大模型的最大激活值,发现同等参数规模的模型间峰值可相差数千倍,MoE架构比稠密架构峰值低14至23倍,为大模型量化部署提供了关键参考。

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

Agentic AI浪潮来袭,鲲鹏昇腾如何重塑AI算力底座?

昇腾、鲲鹏两大生态的协同,正在为Agentic AI时代构筑起坚实、好用、易用的算力底座。

没有人知道地理空间基础模型的真实水平——多所顶级研究机构联合揭露AI领域一个被忽视已久的系统性问题

没有人知道地理空间基础模型的真实水平——多所顶级研究机构联合揭露AI领域一个被忽视已久的系统性问题

多所顶级机构联合审查152篇论文发现,地理空间基础模型领域存在测试标准混乱、数据不公开、结果无法比较等系统性问题,并提出六条改进建议。

AI助手背后的"安全漏洞":当AI帮你办事时,谁在监管它的一举一动?——加州大学圣巴巴拉分校等机构的最新研究揭示了执行框架安全的盲区

本研究提出HarnessAudit框架,通过审计AI智能体的完整执行轨迹而非最终输出,发现任务完成与安全合规存在系统性矛盾,资源访问和多智能体信息流是最主要的违规集中区。

红帽AI创新团队与MIT-IBM Watson AI实验室联手,让AI大脑"多层同时思考"成为现实

红帽AI创新团队与MIT-IBM Watson AI实验室联手,让AI大脑"多层同时思考"成为现实

红帽AI与MIT-IBM团队提出SNLP框架,将Transformer层间依赖转化为方程组并行求解,配合SNLP感知训练,实现最高2.3倍加速同时降低困惑度。

Spotify推出AI智能体,每天为你定制专属播客

Spotify推出AI智能体,每天为你定制专属播客

Spotify推出独立AI应用Studio,可根据用户的收听历史、邮件、日历等数据,每日自动生成个性化简报、播客和歌单。该应用支持聊天提示操作,生成内容可保存至Spotify资料库,将面向18岁以上用户开放研究预览。此外,Spotify还推出播客聊天机器人及个人播客功能。谷歌、亚马逊、微软等科技巨头也已布局AI播客领域。

August Robotics获3000万美元融资,推动建筑施工精准自动化

August Robotics获3000万美元融资,推动建筑施工精准自动化

澳大利亚建筑机器人公司August Robotics宣布完成3000万美元新一轮融资,由Big Pi Ventures领投,Blackbird、Skip Capital等现有投资方及美国建筑专业机构GS Futures跟投。公司将利用该资金加速推进软件协同机器人平台的落地应用,重点覆盖超大规模数据中心等建筑场景。其钻孔机器人可自动读取施工坐标、精准打孔,大幅压缩工期,已在美国和欧洲多个超大规模建筑项目中完成部署。

具身AI走出实验室,规模化挑战仍待破解

具身AI走出实验室,规模化挑战仍待破解

在新加坡ATxSummit科技峰会上,业界领袖指出,尽管机器人形态的具身AI因硬件、仿真与传感器技术进步而能力显著提升,但更广泛的落地应用仍依赖于可靠性、安全性、成本、数据可用性及更完善的治理标准。英伟达首席科学家Dally强调,下一突破在于让机器人执行未经明确编程的任务。东京大学教授松尾豊提醒,该行业仍处于早期阶段,架构、算法、数据与安全系统均需持续完善。

ModelCat入选2026年亚马逊设备气候科技加速器计划

ModelCat入选2026年亚马逊设备气候科技加速器计划

ModelCat宣布入选2026年亚马逊设备气候科技加速器,该项目由亚马逊与Plug and Play技术中心联合开展,旨在支持能降低消费设备碳排放的创新技术。本届共15家企业入选,涵盖可持续电池、低碳材料、半导体创新等领域。ModelCat将探索边缘AI如何降低消费设备能耗与碳足迹,通过在设备端直接运行AI推理,减少对云端处理的依赖,提升能效并支持规模化部署。

"Gemini built in"计划落地:谷歌将把AI功能引入更多第三方智能音箱

"Gemini built in"计划落地:谷歌将把AI功能引入更多第三方智能音箱

谷歌在I/O 2026大会上宣布推出"Gemini built in"方案,将AI功能扩展至第三方摄像头、扬声器等设备。该计划为第三方品牌提供一站式解决方案,包含构建Gemini硬件所需的参考设计。沃尔玛旗下Onn品牌或成首批合作伙伴之一,搭载Gemini的智能扬声器近期已有泄露消息。此外,谷歌还向开发者开放智能家居核心功能,并支持运营商将Google Home Premium集成至自家服务中。

Spotify推出"Studio"应用:借鉴NotebookLM,用个人数据生成专属播客

Spotify推出"Studio"应用:借鉴NotebookLM,用个人数据生成专属播客

Spotify在"投资者日"活动上发布了实验性桌面应用"Studio",该应用可获取用户授权后,整合收听习惯、日历、邮件、笔记等个人数据,通过AI生成个性化播客节目。用户可自定义提示词,让AI生成每日简报、邮件摘要或公路旅行歌单等内容。这一功能与谷歌NotebookLM的Audio Overviews类似,但Spotify可主动抓取外部信息。该功能将在未来数周内向20余个地区18岁以上用户开放测试。

联想Legion游戏平板大尺寸回归:11英寸与13英寸新品发布,附全新游戏手机

联想Legion游戏平板大尺寸回归:11英寸与13英寸新品发布,附全新游戏手机

联想Legion Y900系列正式在中国发布,提供11.1英寸和13英寸两款游戏平板。两款产品均搭载3840×2560分辨率144Hz高刷屏,分别配备联发科天玑9500S和骁龙8 Gen 5芯片,支持可拆卸键盘,电池容量分别达11000mAh和12700mAh。售价约合人民币3200元至4000元,目前暂无全球发售计划。此外,联想还同步推出Legion Y70游戏手机,搭载骁龙8 Gen 5及6.8英寸屏幕。