最新文章
手机里的NPU越来越强,为什么AI体验还在原地踏步?

手机里的NPU越来越强,为什么AI体验还在原地踏步?

尽管芯片厂商不断推出性能更强的神经处理单元,声称比上代产品快30-40%,但大多数AI功能仍依赖云端处理。专家指出,云端AI模型拥有数千亿参数,而手机NPU只能处理约30亿参数的模型。本地AI处理虽然在隐私保护和可靠性方面具有优势,但受限于内存容量和处理能力,目前主要应用于特定场景。业界正致力于优化模型压缩技术,实现云端与本地AI的混合处理模式。

如何使用现有基础设施让数据做好AI准备

如何使用现有基础设施让数据做好AI准备

Hammerspace通过现有NVMe存储最大化GPU使用率。随着AI计算在混合云和多云环境中扩展,基础设施团队面临着加速洞察时间同时最大化GPU投资的压力。Hammerspace Tier 0将GPU服务器集群内的本地NVMe存储转换为超高速共享存储层,性能比传统网络存储提升10倍,减少检查点时间,提高GPU使用率,改善推理响应时间,无需额外存储系统,节省数百万美元成本。

IT领导者快问快答:思科光网络公司首席数字信息官Craig Williams分享AI转型经验

IT领导者快问快答:思科光网络公司首席数字信息官Craig Williams分享AI转型经验

Ciena副总裁兼首席数字信息官Craig Williams分享了光网络和高速连接提供商如何应对AI挑战。他指出这一转型过程"既令人兴奋又让人谦卑,没有既定的变革模板"。Williams团队已评估超过250个AI创意,并将最有前景的项目投入实施。他强调了两个AI战略应用:利用AI辅助编程提升内部效率,以及通过AI降低数字基础设施能耗。

Anthropic CEO警告AI行业泡沫化,批评"YOLO"式投资

Anthropic CEO警告AI行业泡沫化,批评"YOLO"式投资

Anthropic首席执行官达里奥·阿莫代在峰会上警告AI行业存在泡沫风险,暗示某些竞争对手采取过于激进的策略。他提到一些公司存在"YOLO"心态,进行大规模循环投资,可能因时机判断错误而面临风险。阿莫代强调,虽然技术发展稳健,但经济层面存在不确定性,数据中心建设需要提前1-2年规划,买多买少都有风险。

雅虎利用AI实时总结橄榄球比赛精彩内容

雅虎利用AI实时总结橄榄球比赛精彩内容

雅虎在其体育应用中推出了名为"比赛解析"的新功能,利用AI模型自动生成比赛快照。该功能包含三个核心部分:比赛摘要、重要比赛片段流和后续问题提示。AI模型不仅挖掘统计数据,还试图理解比赛的情感层面和人文故事。雅虎计划结合自身记者团队和用户反馈来训练系统,使其更好地理解体育比赛中真正重要的内容。未来该功能将扩展到其他体育项目,并可能提供个性化定制服务。

押注AI智能体,奇奇科技跨越十年的“换挡”与远航

押注AI智能体,奇奇科技跨越十年的“换挡”与远航

阿里云正在携手伙伴将AI像水电一样输送到各行各业,而像奇奇科技这样的生态“毛细血管”,必须具备将这些“水电”接入企业“最后一公里”的能力。

联想天禧AI及创新终端设备在2025 AIE博览会获两项大奖,引领个人AI体验创新
2025-12-05

联想天禧AI及创新终端设备在2025 AIE博览会获两项大奖,引领个人AI体验创新

联想集团在AIE 上,集中展示了混合式AI战略下的系列创新成果,凭借在个人AI领域的突出表现,接连荣获两项行业重要奖项。

2025-12-05

豆包手机助手调整部分AI能力 呼吁保障用户AI使用权

豆包手机助手调整部分AI能力 呼吁保障用户AI使用权

浙江大学突破视频AI瓶颈:让计算机用"金字塔眼光"看视频,速度提升10倍不掉质量

浙江大学突破视频AI瓶颈:让计算机用"金字塔眼光"看视频,速度提升10倍不掉质量

浙江大学研究团队提出金字塔稀疏注意力技术,通过模仿人类视觉的自适应处理机制,为不同重要性的视频信息分配不同精度的计算资源。该方法在保持视频质量的同时将计算量降低至35%,在视频生成任务中即使在91%稀疏度下仍保持优异性能,为解决视频AI的计算瓶颈提供了突破性方案。

KAIST团队破解大模型"组队"难题:什么时候"合作"最有效?

KAIST团队破解大模型"组队"难题:什么时候"合作"最有效?

KAIST研究团队提出SAFE框架,解决大语言模型合作中的关键问题。通过主厨+助手分工模式,SAFE只在必要时触发模型合作,避免传统方法的"事事商量"低效模式。该方法基于语言兼容性和意见一致性两大判断标准,在数学推理等复杂任务中平均提升5.72%性能,运行速度接近单模型,为AI系统协作提供了高效实用的解决方案。

北京大学团队突破AI图像编辑瓶颈:让机器像人类一样理解编辑指令

北京大学团队突破AI图像编辑瓶颈:让机器像人类一样理解编辑指令

北京大学团队开发了革命性的AI图像编辑训练框架Edit-R1,通过让多模态大语言模型充当"导师"实时指导AI学习,突破了传统训练方法的局限。该框架在权威测试中全面超越现有技术,让AI能像人类一样理解编辑指令。这项技术将大大降低图像编辑门槛,让普通用户仅通过自然语言就能实现专业级编辑效果,有望彻底改变图像编辑行业的未来发展。

浙江大学提出XKG:让AI自动复现科研论文的神奇知识图谱

浙江大学提出XKG:让AI自动复现科研论文的神奇知识图谱

浙江大学研究团队开发了XKG(可执行知识图谱),这是一个革命性的AI系统,能够自动复现科研论文中的实验结果。XKG通过将技术概念与可执行代码直接关联,解决了传统AI系统只能生成粗糙代码框架的问题。在PaperBench测试中,XKG使AI智能体性能提升超过10%,特别是在处理基于现有技术改进的分析性论文时效果显著。该系统采用完全自动化的构建流程,为大规模科研知识管理提供了新思路。

中科院团队突破AI诚信对齐新难题:仅需千分之一标注数据,让大模型学会"知之为知之"

中科院团队突破AI诚信对齐新难题:仅需千分之一标注数据,让大模型学会"知之为知之"

中科院团队提出EliCal框架,通过两阶段训练解决大语言模型诚信对齐难题。该方法仅需0.18%的标注数据就能达到传统方法98%的性能,并在未见任务上表现优异。研究还构建了包含63万样本的HonestyBench基准数据集,为AI诚信评估提供标准平台,推动可信AI发展。

微软AI首次让小型语言模型变身超级推理机:8B参数媲美600B巨无霸

微软AI首次让小型语言模型变身超级推理机:8B参数媲美600B巨无霸

微软亚洲研究院团队提出深度自进化推理方法,让80亿参数的小型AI模型通过反复自我验证和改进,在数学推理任务上超越6000亿参数的大模型。该方法基于马尔科夫链理论,通过多轮迭代让模型深度思考,成功解决了5道原本无法解答的竞赛难题,为AI推理能力提升开辟了用计算时间换取模型能力的新路径。

拯救AI视觉智能的终极数据库:Hugging Face团队如何让机器彻底学会"看懂"世界

拯救AI视觉智能的终极数据库:Hugging Face团队如何让机器彻底学会"看懂"世界

Hugging Face联合多所顶尖大学发布FineVision数据集,这是目前最大规模的开源视觉语言训练数据库,包含2400万个高质量样本。通过创新的半自动化处理流程和严格的质量控制,该数据集显著提升了AI视觉理解能力,使开源模型性能大幅超越现有基准。完全开源的FineVision为全球AI研究社区提供了宝贵资源,有望推动视觉AI技术的民主化发展。

大型推理模型的"注意力劫持"危机——亚马逊研究团队揭示AI推理过程的致命弱点

大型推理模型的"注意力劫持"危机——亚马逊研究团队揭示AI推理过程的致命弱点

亚马逊研究团队发现大型推理模型存在严重的"推理分心"安全漏洞:攻击者通过在输入中嵌入复杂干扰任务,可让顶级AI系统准确率下降60%。研究揭示了三种攻击模式,发现强化学习训练反而会增加脆弱性,并提出了有效的防御训练方法,为构建更安全可靠的AI系统提供了重要指导。

Salesforce发布EDR:让AI智能体像专业分析师一样做企业深度研究

Salesforce发布EDR:让AI智能体像专业分析师一样做企业深度研究

Salesforce AI Research开发了EDR企业深度研究系统,这是一个可操控的多智能体AI框架,能像专业分析师团队一样处理复杂企业研究任务。系统包含主规划智能体、四个专业搜索智能体、企业工具生态和反思机制,支持实时人工指导。在多个基准测试中表现卓越,同时提供完整的研究轨迹数据集,为企业AI研究应用树立新标准。

苹果AI研究院惊人突破:让电脑代理人既能点击又能编程的混合行动技术

苹果AI研究院惊人突破:让电脑代理人既能点击又能编程的混合行动技术

苹果公司和香港大学联合研究团队开发了UltraCUA系统,这是首个能够同时使用GUI操作和程序工具的混合行动AI。该系统通过自动化工具收集、合成数据生成和两阶段训练,在OSWorld基准测试中实现了41%的成功率,比传统方法提高22%,步骤数减少11%,为电脑操作AI开辟了新方向。

Meta发布Embody 3D:首个覆盖500小时完整人体动作的3D数据集,重新定义虚拟人运动研究

Meta发布Embody 3D:首个覆盖500小时完整人体动作的3D数据集,重新定义虚拟人运动研究

Meta Codec Avatars实验室发布了Embody 3D,这是迄今最大规模的3D人体动作数据集,包含500小时个人动作数据和超过5400万帧记录。该数据集覆盖七大类动作场景,从基础动作到复杂多人互动,使用80台高精度摄像机和640通道音频系统收集。与现有数据集相比,它首次同时提供了大规模、高质量3D追踪、完整身体形状、手部追踪、音频和文本标注,为虚拟人技术、机器人学和人机交互研究提供了前所未有的综合资源。

私有化云端:私有云和主权云的崛起

私有化云端:私有云和主权云的崛起

Gartner预测,到2029年,超过50%的企业将采用数字主权策略,以确保对数据和关键系统的国家控制。主权云将在这些策略中发挥关键作用,使企业能够在确保合规性的同时实现系统"云化"。企业正在采用私有云、主权云和本地数据中心等多种云私有化模式,主要驱动因素包括业务一致性、IT资源、成本和性能考量。