随着5G流量快速增长和新用例不断涌现,网络运营商需要在最小化环境影响的同时管理密集网络使用。Orange法国与爱立信合作开展创新试验,测试FDD大规模MIMO天线集成无线电,优化高流量区域频谱使用。双方还探索Cloud RAN和Open RAN架构,通过虚拟化RAN功能实现灵活的软件中心网络。合作重点关注利用AI驱动的自动化和意图驱动技术提升能源效率,在不影响性能的前提下动态调整网络资源以降低能耗。
微软正在将Windows 11改造为"智能代理操作系统",在任务栏中集成AI代理功能。新功能允许AI代理在后台执行任务,用户可通过任务栏图标查看进度状态。微软还在文件资源管理器中集成Copilot,提供文档摘要、文件问答等功能。此外,Click to Do功能得到改进,可将网页表格转换为Excel文档。这些AI功能采用本地AI和云端AI混合模式,为用户提供更智能的操作体验。
谷歌发布最新Gemini 3基础模型,在推理能力方面实现重大突破。该模型在人类最终考试基准测试中创下37.4分新纪录,超越此前GPT-5 Pro的31.64分。同时推出Gemini驱动的编程界面Google Antigravity,提供多面板智能编程体验,类似Warp或Cursor 2.0等智能IDE。目前Gemini应用月活用户超6.5亿,已有1300万软件开发者使用该模型。
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。
英国国王学院研究团队开发了潜在精炼解码(LRD)技术,解决了AI文本生成中的速度与准确性平衡难题。该方法通过两阶段设计模仿人类思考过程:先让AI在连续空间中"深思熟虑",保持多种可能性的混合状态,然后"果断行动",逐步确定答案。实验显示,LRD在编程和数学推理任务中准确性提升最高6.3个百分点,生成速度提升最高10.6倍,为AI并行文本生成开辟了新路径。
清华大学团队开发的ViSurf是一种创新的大型视觉语言模型训练方法,巧妙融合了督导式学习和强化学习的优势。该方法通过将标准答案整合到强化学习过程中,让AI既能从正确答案中学习又能保持自主推理能力。实验显示ViSurf在多个视觉任务上显著超越传统方法,特别是在处理模型知识盲区时表现突出,同时有效避免了灾难性遗忘问题,为AI训练提供了更高效稳定的新范式。
慕尼黑工业大学研究团队开发了名为CoBia的新方法,通过构造虚假对话历史来测试11个主流大语言模型的隐藏偏见。研究发现,看似"政治正确"的AI系统实际上仍携带深层偏见,传统测试方法检测率不足20%,而CoBia方法可达80%以上,揭示了当前AI安全防护的重要盲点。
这项研究通过球形投影技术将三维森林点云转换为二维图像,结合特征丰富化和不确定性感知的半自动标注系统,显著提升了激光雷达数据的语义分割效率和准确性。团队构建了首个红树林激光雷达数据集Mangrove3D,验证了方法在不同生态环境中的通用性,为森林监测、碳汇评估和生物多样性保护提供了强有力的技术支持。
维尔茨堡大学和汉堡大学研究团队发现,先进的AI语言模型在回答相同事实问题时会出现"变脸"现象——简单问题回答正确,但在复杂询问中却给出错误答案。通过测试16个模型和600个问题组合,研究揭示了这种不一致性主要源于AI内部不同的神经处理路径,并开发出78%准确率的预测工具。这一发现挑战了当前AI评估方法,为构建更可靠的AI系统提供了重要方向。
上海AI实验室研究团队开发了VPPO算法,通过精确识别AI推理过程中真正依赖视觉信息的关键步骤,重点强化这些环节的学习,解决了现有多模态AI系统"猜对"而非"看懂"的问题。在多项测试中,该算法显著提升了AI的视觉推理准确率,为构建真正理解视觉信息的AI系统开辟了新路径。
OPPO AI Agent团队发布的研究揭示了现有AI在学术推理方面的重大局限。通过构建包含50个跨学科高难度问题的ACADREASON基准测试,研究发现即使最先进的GPT-5也只获得16分通过率。该研究为评估AI学术能力提供了新标准,指出当前AI在深度推理和批判思维方面仍有很大提升空间。
上海AI实验库等机构联合开发了名为InternSVG的人工智能系统,专门处理SVG矢量图形的理解、编辑和生成任务。该系统构建了包含1600万训练样本的SAgoge数据集,涵盖图标、插图、化学结构图和动画四大领域,并建立了全面的SArena评测基准。通过统一建模方法和两阶段训练策略,InternSVG在各项任务中显著超越现有方法,为图形AI领域带来重大突破。
微软在Ignite 2025大会上预览了Windows的重要更新,显示出操作系统向支持AI智能体的根本性转变。新增功能包括原生支持模型上下文协议(MCP)、智能体连接器注册表、明确的权限管控模型,以及独立的智能体工作空间。这些更新建立了OS级别的身份验证、授权和审计机制,让智能体能够安全地执行文件操作和系统设置等任务,同时保持可控性和可追溯性。
苹果即将发布的macOS Tahoe 26.2系统将支持通过雷雳5连接多台Mac设备,构建低延迟AI超算集群。该功能支持Mac Studio、M4 Pro Mac mini和MacBook Pro等设备。四台Mac Studio可高效运行万亿参数的Kimi-K2-Thinking模型,功耗不到500瓦,比传统GPU集群低10倍。此外,MLX项目将获得M5芯片神经加速器的完整访问权限。
人工智能基础设施初创公司Lambda宣布完成超过15亿美元的E轮融资,由TWG Global领投。Lambda运营专为AI工作负载优化的云平台,提供可配置多达16.5万张显卡的AI环境。公司将利用新资金建设数据中心,计划在堪萨斯城建造拥有2.4万兆瓦初始计算能力的AI数据中心,预计明年初开放时将包含1万张英伟达Blackwell Ultra显卡。Lambda还与微软签署了价值数十亿美元的云合同。
谷歌发布最智能的Gemini 3模型,引入生成式用户界面模式,可为复杂多模态问题自动创建独特界面。该技术能动态生成最佳视觉布局,包含交互工具和模拟功能。例如解释三体问题时生成物理演示,回答抵押贷款问题时创建交互计算器。这标志着AI接近"超级软件"阶段,能为任何需求动态创建最优用户界面,代表计算史上第三次重大用户界面范式转变。
微软发布新的数字标牌模式,专为公共场所非交互式显示屏设计。该模式可在15秒后自动隐藏蓝屏死机和错误对话框,避免在公共场合显示系统错误信息。此外,微软还推出时间点还原功能,允许用户将PC恢复到之前的工作配置,支持4-24小时频率的快照备份。新版Windows还将支持后量子加密算法和硬件加速BitLocker加密,提升安全性和性能。
瑞士洛桑联邦理工学院研究团队开发出"稳定视频无限"技术,通过创新的"错误循环利用"方法解决了AI视频生成长度限制问题。该技术让AI在训练时主动学习处理各种错误,从而能够生成任意长度的高质量视频内容,支持复杂场景转换和多模态控制,为内容创作、教育和娱乐行业带来revolutionary变革。