最新文章
阿里团队可能揭露了下一代AI路线:AgentEvolver如何实现智能体的自我进化
2025-11-18

阿里团队可能揭露了下一代AI路线:AgentEvolver如何实现智能体的自我进化

阿里团队可能揭露了下一代AI路线:AgentEvolver如何实现智能体的自我进化

数据库领跑者OceanBase公布五年成绩单:年均增速超100%,客户数破4000家

数据库领跑者OceanBase公布五年成绩单:年均增速超100%,客户数破4000家

OceanBase凭“一体化+多云原生”领跑分布式数据库。

2025-11-18

SuperX AI任命科技领军人物黄陈宏博士为董事局主席兼CEO

SuperX AI Technology Limited任命企业科技资深领军人物黄陈宏博士为董事局主席兼CEO,加速全球AI基础设施布局黄博士在 SAP、戴尔和施耐德电气三十年的跨国科技企业高管经验将加速SuperX 的模块化AI 工厂与全栈基础设施战略部署。

AI重塑交通运输:无人驾驶汽车只是冰山一角

AI重塑交通运输:无人驾驶汽车只是冰山一角

随着AI技术不断发展,交通运输行业正迎来重大变革。MIT研究显示,AI将很快自动化价值650亿美元的交通工作,大幅提升运输效率。从陆地到海空,AI正在推动全方位的交通创新。斯坦福专家强调,AI将通过基础模型、合成数据和数字孪生等技术,实现从单一车辆自动化到整个交通网络优化的跨越式发展,同时解决可持续性、安全性和公平性等关键挑战。

研究显示大语言模型数学计算能力令人担忧

研究显示大语言模型数学计算能力令人担忧

波兰研究团队开发ORCA数学基准测试,对五个主流大语言模型进行评估。结果显示ChatGPT-5、Gemini 2.5 Flash、Claude Sonnet 4.5、Grok 4和DeepSeek V3.2的准确率均低于63%。测试涵盖生物化学、工程建筑、金融经济等七个领域的500道数学题目。研究发现模型主要在四舍五入和计算错误方面存在问题,表明自然语言推理进步并未直接转化为可靠的计算能力。

数据中心和加密货币挖矿将推高2026年电价

数据中心和加密货币挖矿将推高2026年电价

美国能源信息署预测,2026年批发电力价格将上涨8.5%至每兆瓦时51美元,主要由数据中心和加密货币挖矿需求驱动。尽管可再生能源发电比例将达到创纪录的26%,加上核电18%的贡献,无碳发电将占总量44%,但整体碳排放变化不大。AI数据中心的快速增长成为电力需求最大推动因素,谷歌宣布到2027年在德州增投400亿美元建设数据中心。

台湾AI工厂将采用VAST Data存储方案为7000颗Blackwell GPU提供数据支持

台湾AI工厂将采用VAST Data存储方案为7000颗Blackwell GPU提供数据支持

GMI Cloud在台湾投资5亿美元建设AI工厂数据中心,将使用VAST Data存储系统为7000个Blackwell GPU提供数据支持。该项目与英伟达合作,GPU将配备NVLink、InfiniBand和Spectrum-X以太网网络,部署在96个机架中,每秒可处理约200万个令牌,功耗16兆瓦。VAST的EB级数据基础设施支持模型训练、推理和实时数据处理。

AWS推出智能体加速专业服务咨询项目

AWS推出智能体加速专业服务咨询项目

亚马逊云科技发布一套人工智能代理工具,旨在简化其专业服务团队的工作流程。该工具集以AWS Professional Services Delivery Agent为核心,能够将通常需要数月完成的任务压缩至几天内完成,同时降低项目成本。该代理可通过上传架构图启动项目,从会议记录和文档中提取需求,自动生成项目提案。此外,还包含基于AWS Transform的专门代理,用于自动化软件迁移工作,能够处理COBOL大型机程序、VMware工作负载和.NET应用程序的云端迁移。

联想携手中足联点亮首个全栈AI总指挥中心
2025-11-18

联想携手中足联点亮首个全栈AI总指挥中心

国内首个全栈AI总指挥中心在京点亮,助推足球赛事迈入AI新时代

AI模型突破理解与生成鸿沟:港科大团队推出GIR-Bench基准测试套件

AI模型突破理解与生成鸿沟:港科大团队推出GIR-Bench基准测试套件

香港科技大学团队发表重要研究,开发GIR-Bench测试基准评估统一多模态AI模型的推理与生成能力。研究发现即使最先进的AI模型在理解与生成之间也存在显著差距,无法有效将推理过程转化为准确的视觉生成,为AI行业发展提供重要警示。

Meta研究团队:让AI写作也能接受"奖惩教育"的新方法

Meta研究团队:让AI写作也能接受"奖惩教育"的新方法

Meta超级智能实验室联合麻省理工学院开发了SPG三明治策略梯度方法,专门解决扩散语言模型强化学习训练中的技术难题。该方法通过上下界策略为AI模型提供精确的奖惩反馈机制,在数学和逻辑推理任务上实现了显著性能提升,为AI写作助手的智能化发展提供了新的技术路径。

上海AI实验室推出Vlaser:让机器人像人一样思考和行动的突破性模型

上海AI实验室推出Vlaser:让机器人像人一样思考和行动的突破性模型

上海AI实验室联合多所知名高校推出的Vlaser模型,成功将机器人的视觉理解、语言处理和精确行动能力统一在单一架构中。该模型基于600万个高质量训练样本构建,在12项综合测试中全面领先同类产品,实际机器人操作成功率超过64%,为机器人智能从工具向伙伴的转变奠定了重要基础。

首尔国大团队重磅发现:视觉幻觉背后的"不确定性"秘密被破解

首尔国大团队重磅发现:视觉幻觉背后的"不确定性"秘密被破解

首尔国立大学研究团队通过深入分析大型视觉语言模型发现,AI产生视觉幻觉的根本原因在于视觉编码器中存在"不确定性"标记。他们创新性地使用对抗性攻击识别这些不确定标记,并通过智能屏蔽策略显著降低了物体幻觉率。该方法无需重新训练模型,与现有AI系统高度兼容,为构建更可靠的人工智能系统提供了实用解决方案。

港大团队推出数学AI新突破:让计算机"画图思考"解决数学难题

港大团队推出数学AI新突破:让计算机"画图思考"解决数学难题

这项由港大、美团、港中大联合开展的研究提出了CodePlot-CoT系统,让AI通过生成绘图代码来进行数学视觉推理。该系统解决了现有AI无法有效处理需要画图辅助的数学题难题,在专门构建的Math-VR数据集上取得21%的性能提升,为AI数学推理开辟了新方向。

不只是训练智能助手,环境也需要"调教":谷歌、西湖大学等顶尖机构联合发现AI训练的全新思路

不只是训练智能助手,环境也需要"调教":谷歌、西湖大学等顶尖机构联合发现AI训练的全新思路

这项研究提出了革命性的"环境调教"AI训练方法,通过让AI的练习环境变得更智能来提升学习效果。仅用400个样本就让基础模型成功率从7%提升至37%,超越多个商业模型。该方法包含四阶段渐进训练、智能环境反馈、细粒度奖励机制,解决了数据稀缺和泛化能力差的核心问题,为AI训练开辟全新范式。

腾讯团队革命性突破:让代码自己"看"自己写出来的网页,再改进到完美

腾讯团队革命性突破:让代码自己"看"自己写出来的网页,再改进到完美

腾讯团队开发的ReLook框架首次让AI具备"看见"自己编写网页效果的能力。该系统通过建立生成-诊断-改进循环,让AI能够实时预览代码的视觉呈现,并基于多模态大模型的视觉反馈不断优化。ReLook在多个基准测试中显著超越传统方法,为AI辅助前端开发开辟了全新路径。

普林斯顿大学重磅发现:AI模型也需要"个性化教学",STAT方法让数学能力飞跃提升

普林斯顿大学重磅发现:AI模型也需要"个性化教学",STAT方法让数学能力飞跃提升

普林斯顿大学研究团队开发了STAT方法,通过让AI"老师"分析"学生"模型的技能缺陷,针对性制定训练方案。该方法在数学能力测试中实现了7.5%的显著提升,并在未见过的竞赛中平均提升4.6%。这种个性化AI训练方法突破了传统"一刀切"训练的局限,证明AI模型也需要因材施教的精准指导。

OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁

OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁

三行代码构建AI应用,实现百亿级多模数据的混合搜索。

浙江大学团队打造会玩浏览器的AI助手:真正像人类一样上网搜索信息

浙江大学团队打造会玩浏览器的AI助手:真正像人类一样上网搜索信息

这项由中科院、滑铁卢大学等多所院校联合完成的研究开发了BrowserAgent,一个能够像人类一样直接操作网页浏览器的AI助手。与传统需要转换工具的方法不同,它能直接点击、滚动、搜索网页,仅用5300个训练样本就在多跳推理任务上比最先进模型提升20%准确率。

字节跳动虚拟宽度网络:不扩张主干也能拥有更强大脑的秘密
2025-11-18

字节跳动虚拟宽度网络:不扩张主干也能拥有更强大脑的秘密

字节跳动Seed团队提出的虚拟宽度网络(VWN)通过解耦嵌入宽度与主干宽度,在几乎不增加计算成本的情况下显著提升模型表示能力。8倍虚拟宽度扩展使训练效率提升2.5-3.5倍,且发现虚拟宽度因子与损失呈对数线性关系,为大模型效率优化开辟新维度。