最新文章

上交大与上海人工智能实验室联手:只需一段训练视频,AI就能完美控制摄像机运动

上海交大与上海AI实验室提出Warp-as-History,将摄像机运动转化为AI可理解的伪历史画面,仅用一段视频微调一小时,实现媲美海量数据训练方法的摄像机控制效果。

利亚德沙特 LED 视效工厂预计 7 月投产,Micro LED 本地交付进入中东

利亚德沙特 LED 视效工厂预计 7 月投产,Micro LED 本地交付进入中东

今天讲的出海案例是利亚德,这家 1995 年成立、从 LED 显示产品研发生产销售起步,并做到小间距和 Micro LED 的视效科技公司,沙特工厂预计 2026 年 7 月投产。

谷歌将街景数据接入Genie世界模型,可模拟真实街道场景

谷歌将街景数据接入Genie世界模型,可模拟真实街道场景

谷歌DeepMind宣布将Street View街景数据接入Genie世界模型,用户可基于真实地点生成可交互的沉浸式环境,并支持调整天气、季节等参数。该功能已于谷歌I/O开发者大会正式发布,面向美国Ultra订阅用户开放,后续将扩展至全球用户。目前Genie已助力Waymo自动驾驶模拟器训练极端场景,但模型尚不具备物理感知能力,画面质量仍处于游戏级别,研究团队预计6至12个月内将显著提升。

保险巨头揭秘现代化改造:何时推进,何时放弃

保险巨头揭秘现代化改造:何时推进,何时放弃

Liberty Mutual与Travelers两大保险公司高管在2026年MIT斯隆CIO研讨会上分享了系统现代化经验。Liberty Mutual通过"技术债务雷达"框架,评估哪些系统需立即升级、哪些需持续监控。Travelers则将改造重点放在提升客户体验和运营效率的关键路径上,已将70%的计算负载迁移至云端,并借此推进AI应用,包括利用AI智能体优化理赔流程。两家公司均强调,现代化决策需高层对齐,并逐级落实。

Thoughtworks AI Labs研发的"AI学习路由法":让语言模型自己给自己规划学习路线,效果远超传统训练方式

Thoughtworks AI Labs研发的"AI学习路由法":让语言模型自己给自己规划学习路线,效果远超传统训练方式

Thoughtworks AI Labs提出动态潜在路由(DLR),让语言模型通过内部代码自主规划处理路线,在低数据微调场景下平均超越监督微调6.6个百分点,同时让AI推理过程变得可直接观察和干预。

谷歌全面升级AI订阅计划,用户该如何选择?

谷歌全面升级AI订阅计划,用户该如何选择?

谷歌在I/O大会上对旗下Gemini AI订阅计划进行了全面调整。AI Ultra计划降价至200美元/月,并新增100美元/月的开发者版本。新功能包括:AI智能体Gemini Spark、虚拟世界创作工具Project Genie、视频生成模型Gemini Omni,以及更快的Gemini 3.5 Flash模型。Gmail AI收件箱、每日简报等功能也向更多订阅层级开放。此外,谷歌引入基于算力的用量计算方式,替代原有的按提示次数计费模式。

西安交通大学等多所顶尖高校联合出品:当AI"智能体军团"学会自我诊断和进化,会发生什么?

西安交通大学等多所顶尖高校联合出品:当AI"智能体军团"学会自我诊断和进化,会发生什么?

本文综述了基于大型语言模型的多智能体系统,提出LIFE框架,系统串联个体能力、多智能体协作、故障归因与自我进化四个相互依存的阶段,填补了该领域的理论空白。

无需训练也能更聪明?韩国VIDRAFT公司研发的"达尔文家族"让AI模型通过"基因重组"实现能力跃升

无需训练也能更聪明?韩国VIDRAFT公司研发的"达尔文家族"让AI模型通过"基因重组"实现能力跃升

韩国VIDRAFT公司提出达尔文框架,通过进化算法和诊断引导的参数重组,让AI模型无需训练即可提升推理能力,旗舰模型GPQA得分86.9%全球排名第六。

英特尔制程双线推进:18A良率稳步爬坡,14A目标2029年量产
2026-05-21

英特尔制程双线推进:18A良率稳步爬坡,14A目标2029年量产

随着Intel 18A的产能释放和 Intel 14A路线图的具体化,英特尔正试图在AI算力需求从训练向推理转移的周期中,重新定位其制造业务的技术价值与供应链角色。

贝莱德与谷歌联手推出算力即服务新合资公司

贝莱德与谷歌联手推出算力即服务新合资公司

黑石集团与谷歌宣布成立合资公司,整合数据中心容量与谷歌云张量处理器(TPU),以"算力即服务"模式面向企业市场。黑石初期承诺投入50亿美元股权资本,首批500兆瓦算力预计于2027年上线。谷歌负责提供TPU硬件、软件及技术支持。此举旨在满足AI工作负载需求,同时与CoreWeave等新兴云服务商展开竞争。据Synergy Research Group数据,2026年一季度企业云基础设施支出已达1290亿美元。

2026年全球AI支出将达2.59万亿美元

2026年全球AI支出将达2.59万亿美元

据Gartner最新报告,2026年全球AI支出将同比增长47%,总额达2.59万亿美元。企业在生成式AI模型和AI智能体上的投入将翻番,新增支出约60亿美元。AI基础设施(含AI优化服务器、半导体等)占总支出逾45%,其中AI优化服务器支出预计五年内增至三倍。Gartner分析师指出,2026年将是企业AI投入的拐点年,此前支出主要由科技公司和超大规模云厂商主导。

大语言模型编辑文档易出错,仅Python领域表现可靠

大语言模型编辑文档易出错,仅Python领域表现可靠

微软研究人员通过DELEGATE-52基准测试,对19款大型语言模型在52个专业领域的复杂多步骤任务处理能力进行评估,发现当前LLM在文档编辑中存在严重可靠性问题。顶级模型(包括Gemini、Claude和GPT)在经过20次委托交互后,平均丢失约25%的文档内容,所有模型平均退化率高达50%。研究指出,Python是唯一大多数模型表现"就绪"的领域,企业在使用AI自动化工作流时需保留足够的人工监督机制。

97%企业布局AI,却只有5%的数据真正准备好了

97%企业布局AI,却只有5%的数据真正准备好了

根据邓白氏最新AI动态调查,97%的企业正在推进AI项目,但仅有5%表示其数据已具备支撑AI规模化落地的条件。67%的企业已看到初步投资回报,24%报告了显著收益。然而,数据访问限制、隐私合规风险及数据质量问题仍是主要障碍。专家指出,从试点到规模化部署,企业需要高质量、可治理的数据基础设施,尤其在智能体AI逐步进入生产环境的背景下,数据就绪能力已成为关键。

无线安全:AI 与 AI 之间的攻防对决

无线安全:AI 与 AI 之间的攻防对决

据Cisco对全球6098家企业的调查,85%的企业在过去12个月内经历过至少一次无线安全事件,58%遭受财务损失,其中半数年损失超百万美元。AI驱动的自动化攻击已成为最主要威胁,攻击者借助AI工具可快速识别网络漏洞、规避防御系统。专家指出,应对之策在于以AI反制AI,同时结合零信任架构与网络分段等传统安全策略,构建多层次防御体系。

谷歌将YouTube Premium Lite捆绑进最优存储套餐

谷歌将YouTube Premium Lite捆绑进最优存储套餐

谷歌正将YouTube Premium Lite捆绑至其AI Pro订阅计划中。每月20美元的AI Pro套餐已包含5TB云存储,现新增Premium Lite权益,用户可享受无广告观看(非音乐视频)、后台播放及下载功能。顶级AI Ultra套餐(每月100美元)则提供完整版YouTube Premium。此外,AI Pro订阅者还可享受最高50%的YouTube Premium折扣优惠。

用"假图"训练AI,效果居然比真实数据更好?香港科技大学的这项实验颠覆了你的直觉

用"假图"训练AI,效果居然比真实数据更好?香港科技大学的这项实验颠覆了你的直觉

香港科技大学研究团队发现,用程序自动合成的平面设计图层数据训练AI,效果超过半合成真实数据,并在约5万样本时性能趋于饱和。

谷歌全新Omni AI视频工具:用数字分身克隆自己

谷歌全新Omni AI视频工具:用数字分身克隆自己

谷歌在Google I/O 2026上发布Gemini Omni,这是一款将AI视频创作能力提升至全新高度的工具。用户可融合图像、音频、视频和文本生成高质量视频,并通过"Avatar"功能创建数字分身,让AI代替本人出镜说话。Omni还内置物理模拟引擎,支持自然语言编辑视频,并将接入Gemini应用、Google Flow及YouTube Shorts。谷歌表示已嵌入SynthID数字水印技术以标识AI生成内容。

一个"词"就能搞定视觉推理?香港中文大学&Meta AI联合研究的这项技术让AI"脑补"画面,速度快5倍

一个"词"就能搞定视觉推理?香港中文大学&Meta AI联合研究的这项技术让AI"脑补"画面,速度快5倍

ATLAS是由香港中文大学与Meta AI联合提出的视觉推理框架,将视觉操作压缩为词典中的五个特殊词汇,让AI无需生成图片或调用外部工具,即可完成复杂的交互式视觉推理。

当AI"工作流"遇上乱码困境:Albany大学与IBM联手打造的"智能调度员"如何让工业AI少走弯路

当AI"工作流"遇上乱码困境:Albany大学与IBM联手打造的"智能调度员"如何让工业AI少走弯路

SPIN是由纽约州立大学奥尔巴尼分校与IBM联合提出的工业AI规划框架,通过格式验证修复和前缀渐进执行控制,在减少40%执行步骤的同时提升任务完成率。

北卡罗来纳大学教堂山分校等联合研究团队:让AI学会"感受"重力,视频生成中的人体动作终于有了物理法则的约束

北卡罗来纳大学教堂山分校等联合研究团队:让AI学会"感受"重力,视频生成中的人体动作终于有了物理法则的约束

这项研究提出PhyMotion,通过将AI生成视频中的人体重建为三维骨骼并在物理模拟器中评分,解决现有评估工具无法识别浮空身体、异常关节等物理错误的难题。