最新文章第10页

2026-05-20

浙江大学揭秘：为什么AI画图时"记住噪声"能让效果提升12倍效率？

浙大团队提出PNAPO方法，通过保存AI绘图时的初始噪点，利用整流流直线特性精准还原生成轨迹，配合动态正则化策略，在FLUX和SD3-M上实现12倍训练效率提升。

天禧Claw四大自主创新亮相，成为联想天禧4.0的核心执行力系统

2026年5月19日，联想集团正式发布天禧AI 4.0全栈技术六大焕新升级内容及联想AI主机（AI Center）。

谷歌推出CodeMender智能体，剑指Anthropic安全AI领域布局

谷歌在I/O大会上宣布开放CodeMender API的测试资格，邀请特定专家群体参与测试。CodeMender是一款AI代码安全智能体，能够自动检测并修复代码漏洞。此举被视为谷歌应对Anthropic Claude Mythos Preview在网络安全领域影响力的直接回应。谷歌DeepMind CTO表示，该工具旨在"保护全球代码库安全"。目前谷歌已与多国政府及企业展开合作洽谈，网络安全正成为各大AI实验室争相布局的核心营收方向。

人工智能

自然语言处理

智能体购物

2026-05-20

Google希望用AI成为你的"专属购物助理"

谷歌拥有追踪超过600亿条商品信息的"购物图谱"，并计划借助AI将其转化为个性化购物体验。在Google I/O开发者大会上，谷歌发布了多项由智能体AI驱动的购物新功能，涵盖商品发现、下单及售后全流程。新功能包括与Shopify、沃尔玛等主流平台共同开发的通用商务协议（UCP）、支持用户自定义预算的智能支付协议AP2，以及可跨平台汇总商品的"通用购物车"，后者还能识别价格低点并提示商品兼容性问题。

人工智能

多模态AI

新品发布

2026-05-20

谷歌下调最高级AI订阅计划价格，Gemini功能全面升级

谷歌在I/O大会上宣布，旗舰AI Ultra订阅计划月费从250美元降至200美元，同时推出100美元的新版Ultra方案。此外，谷歌发布了Gemini Spark助手工具，可跨应用完成任务，并将接入Chrome浏览器，通过Android Halo界面展示实时进度。谷歌还推出全新多模态模型家族Gemini Omni，支持文本、音频、图像和视频处理，首款产品Gemini Omni Flash即日起向付费用户开放。

人工智能

多模态技术

世界模型

2026-05-20

谷歌发布多模态AI视频工具Gemini Omni，能够理解和模拟真实世界

谷歌在I/O开发者大会上发布了全新多模态AI产品Gemini Omni。与现有文字转视频工具不同，Omni支持文本、图像、视频等多种输入形式，可生成高度逼真的视频内容。该产品基于Gemini架构，具备高级物理模拟与视频编辑能力，支持替换视频中的单个元素。所有输出内容将自动附加SynthID水印。Omni目前已在Gemini应用、Google Flow及YouTube Shorts上线，后续将向开发者和企业开放API接入，并推出更强大的Omni Pro版本。

人工智能

生成式AI

真实场景与虚拟风格融合

2026-05-20

谷歌Project Genie新功能：将真实地点变为奇幻世界

谷歌在I/O开发者大会上宣布，Project Genie新增基于Google Maps的街景功能。该功能整合了覆盖110个国家、多达2800亿张街景图像的数据集，让用户可以选择真实地点，并通过AI风格转换将其变成奇幻场景，例如将金门大桥变成海底世界。目前该功能仅支持美国地区，未来计划扩展至全球。此外，Project Genie现已向Google AI Ultra订阅用户全球开放。