最新文章第4页

2026-05-21

上交大与上海人工智能实验室联手：只需一段训练视频，AI就能完美控制摄像机运动

上海交大与上海AI实验室提出Warp-as-History，将摄像机运动转化为AI可理解的伪历史画面，仅用一段视频微调一小时，实现媲美海量数据训练方法的摄像机控制效果。

利亚德沙特 LED 视效工厂预计 7 月投产，Micro LED 本地交付进入中东

今天讲的出海案例是利亚德，这家 1995 年成立、从 LED 显示产品研发生产销售起步，并做到小间距和 Micro LED 的视效科技公司，沙特工厂预计 2026 年 7 月投产。

谷歌将街景数据接入Genie世界模型，可模拟真实街道场景

谷歌DeepMind宣布将Street View街景数据接入Genie世界模型，用户可基于真实地点生成可交互的沉浸式环境，并支持调整天气、季节等参数。该功能已于谷歌I/O开发者大会正式发布，面向美国Ultra订阅用户开放，后续将扩展至全球用户。目前Genie已助力Waymo自动驾驶模拟器训练极端场景，但模型尚不具备物理感知能力，画面质量仍处于游戏级别，研究团队预计6至12个月内将显著提升。

Liberty Mutual与Travelers两大保险公司高管在2026年MIT斯隆CIO研讨会上分享了系统现代化经验。Liberty Mutual通过"技术债务雷达"框架，评估哪些系统需立即升级、哪些需持续监控。Travelers则将改造重点放在提升客户体验和运营效率的关键路径上，已将70%的计算负载迁移至云端，并借此推进AI应用，包括利用AI智能体优化理赔流程。两家公司均强调，现代化决策需高层对齐，并逐级落实。

Thoughtworks AI Labs研发的"AI学习路由法"：让语言模型自己给自己规划学习路线，效果远超传统训练方式

大语言模型

动态潜在路由

离散潜在代码

2026-05-21

Thoughtworks AI Labs研发的"AI学习路由法"：让语言模型自己给自己规划学习路线，效果远超传统训练方式

Thoughtworks AI Labs提出动态潜在路由（DLR），让语言模型通过内部代码自主规划处理路线，在低数据微调场景下平均超越监督微调6.6个百分点，同时让AI推理过程变得可直接观察和干预。

人工智能

大语言模型

新功能发布

2026-05-21

谷歌全面升级AI订阅计划，用户该如何选择？

谷歌在I/O大会上对旗下Gemini AI订阅计划进行了全面调整。AI Ultra计划降价至200美元/月，并新增100美元/月的开发者版本。新功能包括：AI智能体Gemini Spark、虚拟世界创作工具Project Genie、视频生成模型Gemini Omni，以及更快的Gemini 3.5 Flash模型。Gmail AI收件箱、每日简报等功能也向更多订阅层级开放。此外，谷歌引入基于算力的用量计算方式，替代原有的按提示次数计费模式。

西安交通大学等多所顶尖高校联合出品：当AI"智能体军团"学会自我诊断和进化，会发生什么？

大语言模型

多智能体协作

故障归因

2026-05-21

西安交通大学等多所顶尖高校联合出品：当AI"智能体军团"学会自我诊断和进化，会发生什么？

本文综述了基于大型语言模型的多智能体系统，提出LIFE框架，系统串联个体能力、多智能体协作、故障归因与自我进化四个相互依存的阶段，填补了该领域的理论空白。

无需训练也能更聪明？韩国VIDRAFT公司研发的"达尔文家族"让AI模型通过"基因重组"实现能力跃升

大语言模型

模型合并

无训练优化

2026-05-21

无需训练也能更聪明？韩国VIDRAFT公司研发的"达尔文家族"让AI模型通过"基因重组"实现能力跃升

韩国VIDRAFT公司提出达尔文框架，通过进化算法和诊断引导的参数重组，让AI模型无需训练即可提升推理能力，旗舰模型GPQA得分86.9%全球排名第六。

英特尔

2026-05-21

英特尔制程双线推进：18A良率稳步爬坡，14A目标2029年量产

随着Intel 18A的产能释放和 Intel 14A路线图的具体化，英特尔正试图在AI算力需求从训练向推理转移的周期中，重新定位其制造业务的技术价值与供应链角色。

云计算

TPU算力

算力即服务新模式

2026-05-21

贝莱德与谷歌联手推出算力即服务新合资公司

黑石集团与谷歌宣布成立合资公司，整合数据中心容量与谷歌云张量处理器（TPU），以"算力即服务"模式面向企业市场。黑石初期承诺投入50亿美元股权资本，首批500兆瓦算力预计于2027年上线。谷歌负责提供TPU硬件、软件及技术支持。此举旨在满足AI工作负载需求，同时与CoreWeave等新兴云服务商展开竞争。据Synergy Research Group数据，2026年一季度企业云基础设施支出已达1290亿美元。

人工智能

大语言模型

AI支出增长

2026-05-21

2026年全球AI支出将达2.59万亿美元

据Gartner最新报告，2026年全球AI支出将同比增长47%，总额达2.59万亿美元。企业在生成式AI模型和AI智能体上的投入将翻番，新增支出约60亿美元。AI基础设施（含AI优化服务器、半导体等）占总支出逾45%，其中AI优化服务器支出预计五年内增至三倍。Gartner分析师指出，2026年将是企业AI投入的拐点年，此前支出主要由科技公司和超大规模云厂商主导。

人工智能

自然语言处理

实验结果

2026-05-21

大语言模型编辑文档易出错，仅Python领域表现可靠

微软研究人员通过DELEGATE-52基准测试，对19款大型语言模型在52个专业领域的复杂多步骤任务处理能力进行评估，发现当前LLM在文档编辑中存在严重可靠性问题。顶级模型（包括Gemini、Claude和GPT）在经过20次委托交互后，平均丢失约25%的文档内容，所有模型平均退化率高达50%。研究指出，Python是唯一大多数模型表现"就绪"的领域，企业在使用AI自动化工作流时需保留足够的人工监督机制。

人工智能

数据治理

企业AI落地

2026-05-21

97%企业布局AI，却只有5%的数据真正准备好了

根据邓白氏最新AI动态调查，97%的企业正在推进AI项目，但仅有5%表示其数据已具备支撑AI规模化落地的条件。67%的企业已看到初步投资回报，24%报告了显著收益。然而，数据访问限制、隐私合规风险及数据质量问题仍是主要障碍。专家指出，从试点到规模化部署，企业需要高质量、可治理的数据基础设施，尤其在智能体AI逐步进入生产环境的背景下，数据就绪能力已成为关键。

人工智能

网络安全

AI 攻防对抗

2026-05-21

无线安全：AI 与 AI 之间的攻防对决

据Cisco对全球6098家企业的调查，85%的企业在过去12个月内经历过至少一次无线安全事件，58%遭受财务损失，其中半数年损失超百万美元。AI驱动的自动化攻击已成为最主要威胁，攻击者借助AI工具可快速识别网络漏洞、规避防御系统。专家指出，应对之策在于以AI反制AI，同时结合零信任架构与网络分段等传统安全策略，构建多层次防御体系。

人工智能

流媒体服务

套餐捆绑

2026-05-21

谷歌将YouTube Premium Lite捆绑进最优存储套餐

谷歌正将YouTube Premium Lite捆绑至其AI Pro订阅计划中。每月20美元的AI Pro套餐已包含5TB云存储，现新增Premium Lite权益，用户可享受无广告观看（非音乐视频）、后台播放及下载功能。顶级AI Ultra套餐（每月100美元）则提供完整版YouTube Premium。此外，AI Pro订阅者还可享受最高50%的YouTube Premium折扣优惠。

用"假图"训练AI，效果居然比真实数据更好？香港科技大学的这项实验颠覆了你的直觉

图像生成

图层分解

合成数据训练

2026-05-21

用"假图"训练AI，效果居然比真实数据更好？香港科技大学的这项实验颠覆了你的直觉

香港科技大学研究团队发现，用程序自动合成的平面设计图层数据训练AI，效果超过半合成真实数据，并在约5万样本时性能趋于饱和。

人工智能

AI视频生成

数字分身技术

2026-05-21

谷歌全新Omni AI视频工具：用数字分身克隆自己

谷歌在Google I/O 2026上发布Gemini Omni，这是一款将AI视频创作能力提升至全新高度的工具。用户可融合图像、音频、视频和文本生成高质量视频，并通过"Avatar"功能创建数字分身，让AI代替本人出镜说话。Omni还内置物理模拟引擎，支持自然语言编辑视频，并将接入Gemini应用、Google Flow及YouTube Shorts。谷歌表示已嵌入SynthID数字水印技术以标识AI生成内容。