新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
英伟达与新兴云服务商CoreWeave签署协议,承诺在2032年前为其提供63亿美元GPU计算容量担保。作为CoreWeave 7%股东,英伟达此举旨在培养与AWS、微软和谷歌抗衡的合作伙伴。该协议平均每年担保9亿美元容量,相当于约9400个GPU的年租赁。这种合作模式反映了AI领域中云服务商、芯片厂商和AI模型开发商之间复杂的资本循环关系。
Luminary Cloud宣布完成7200万美元B轮融资,专注开发"物理AI"技术。该公司云原生平台可将仿真速度提升100倍,利用物理信息模型实时预测汽车、飞机等产品性能。公司推出针对特定行业的预训练模型,包括与本田合作的汽车设计模型和与Otto航空合作的飞机开发模型。融资由西门子风投领投,将用于扩大研发团队和市场销售。
谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。
OpenAI发布了面向AI编程助手Codex的GPT-5新版本。新模型GPT-5-Codex采用动态"思考"机制,可根据编程任务复杂度灵活调整处理时间,从几秒到七小时不等。该模型已向ChatGPT Plus等付费用户推出,在代码重构和审查基准测试中表现优异。相比传统路由器预设计算资源的方式,GPT-5-Codex能实时调整工作时长,这有助于OpenAI在竞争激烈的AI编程工具市场中提升竞争力。
HPE第三财季营收创纪录达到91亿美元,同比增长19%。AI服务器销售大幅增长,新收购的Juniper推动网络业务增长54%。Alletra存储销售实现三位数增长。服务器业务营收49亿美元,AI系统营收达到16亿美元创历史新高。该公司连续四个季度实现营收增长,GreenLake订阅客户增至4.4万,年化营收运行率达31亿美元。
爱立信宣布在其私有5G技术中集成代理式AI,计划2025年第四季度推出。该系统将NetCloud平台与私有5G网络结合,为企业客户提供AI功能、实时特性、简化的生命周期管理等优势。升级版NetCloud助手ANA可处理复杂工作流程、执行管理决策并实时学习,预计将故障停机时间和客户支持案例减少超过20%,助力企业数字化转型。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
谷歌推出全球最强差分私有大语言模型VaultGemma,这是一个10亿参数的模型,基于Gemma架构构建。该模型采用先进数学算法防止敏感数据泄露,通过在数据集中添加受控噪声实现隐私保护。VaultGemma在多项基准测试中表现卓越,性能可媲美同等参数的非私有模型,但完全不会暴露训练数据,为金融和医疗等监管行业的AI应用提供重要保障。
乔治华盛顿大学研究人员开发出"FOMC计算机模拟"项目,成功构建了美联储公开市场委员会会议的AI模型。该项目将每位委员的政策态度和投票记录输入系统,创建数字化委员档案。研究采用双轨模拟框架,结合大语言模型驱动的会议模拟与博弈论投票模型。主要发现显示,在政治压力下,委员会成员会产生分歧并破坏共识。这一技术突破为未来模拟各类群体决策会议奠定了基础。
AI聊天机器人如ChatGPT、Gemini和Grok日益融入日常生活,目前最受欢迎的用途是心理治疗。人们常与它们讨论敏感话题,误以为对话会保持私密。然而,聊天机器人不受保密规则约束。近期发生多起数据泄露事件,包括ChatGPT分享功能导致对话被搜索引擎索引,Grok多达30万次聊天记录被公开。企业中"影子AI"使用也带来风险。专家建议避免分享个人敏感信息,企业应制定相关政策。
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
韩国存储巨头SK海力士宣布完成HBM4开发并准备大规模量产,消息推动其股价上涨7%。随着AMD和英伟达的下一代数据中心GPU将采用HBM4技术,高带宽内存已成为AI加速器的核心组件。SK海力士通过将I/O端子数量增至2048个,有效实现了带宽翻倍,能效提升超过40%,运行速度达到10Gb/s。美光和三星也在积极推进HBM4产品开发。
AI和高性能计算正重塑各行各业,但数据中心为适应多样化工作负载而添加各种专用加速器,反而导致运营效率下降。专用芯片与CPU、GPU等系统组合产生了前所未有的复杂性,功耗飙升至不可持续水平。随着AI模型规模增长和工作负载边界模糊,传统静态硬件分配已不适用。可重构计算提供了新方案:单一平台可动态调整架构以匹配不同需求,消除芯片间通信瓶颈,降低功耗,简化运营。
英伟达发布新款Rubin CPX GPU,专为大规模上下文处理而设计,可支持百万级token的软件编程和生成视频。该产品将搭载于Vera Rubin NVL 144 CPX平台,承诺高能效和卓越推理性能,每投资1亿美元可获得50亿美元token收入。同时,英伟达展示了Blackwell Ultra GB300系统的基准测试结果,DeepSeek-R1推理性能较前代提升1.4倍。
诺基亚与Supermicro建立战略合作伙伴关系,应对AI和云工作负载对数据中心带来的前所未有的挑战。双方将Supermicro的800G以太网交换平台与诺基亚的SR Linux网络操作系统和事件驱动自动化平台相结合,为AI、高性能计算和云环境提供完全集成的数据中心网络解决方案。该方案可实现从设计、部署到日常运营的全生命周期自动化,减少部署时间,降低运营成本,提高整体效率。
奔驰在慕尼黑IAA展会上发布全电动GLC车型,搭载高通骁龙数字底盘解决方案。新车续航里程达713公里,零排放。该车型配备先进数字座舱,集成AI语音交互、3D增强现实导航和杜比全景声等功能。系统能学习用户偏好,提供个性化推荐和免提交互体验。内置5G连接支持车辆与云端实时数据传输。
在Splunk年度会议上,该公司发布两款基于智能代理的安全运营工具。Splunk Enterprise Security基础版和高级版统一了威胁检测、调查和响应工作流程。新功能将智能代理AI置于SOC核心,通过内置AI减少警报噪音,将调查时间从数小时缩短至数分钟。Cisco计划发布更多AI功能支持智能代理SOC,包括安全警报分类、恶意软件逆向分析、剧本创作等能力,让网络安全专业人员专注于更具战略性的工作。