首尔国立大学提出CompactAttention,通过块联合KV选择与零复制分页执行,将分块预填充场景下的长文本注意力计算速度提升至2.72倍,同时保持与密集注意力相近的准确率。
本文介绍清华大学等机构提出的ZEDA方法,通过向已训练MoE模型注入"零专家"并进行两阶段自蒸馏,使模型跳过超半数专家计算,推理速度提升约20%,性能几乎不损失。
上交大等七校联合研究推出Incantation系统,以自然语言为接口实现多角色视频世界模型的实时控制,让AI首次能同时精确指挥多个角色并支持跨角色动作迁移。
AI初创公司Hark Inc.宣布完成逾7亿美元A轮融资,由Parkway Venture Capital领投,英伟达、英特尔资本、AMD Ventures、高通风投及Salesforce Ventures等参与。公司估值达60亿美元。Hark正在开发一系列搭载多模态架构与持久记忆功能的定制AI模型,可记录用户偏好并主动推送任务建议,同时配套推出AI优化硬件设备。公司计划今夏发布首批模型,消费级设备将于稍后上市。
M-A-P研究社区推出OProver,一套会从失败中学习并反复修改证明的数学定理自动证明框架,在五个主流测试集上超越了参数量大出数倍的同类开源模型。
Serverless AI基础设施初创公司Modal Labs宣布完成3.55亿美元新一轮融资,由Redpoint Ventures和General Catalyst领投,Accel和Menlo Ventures跟投,公司估值从去年9月的11亿美元跃升至46.5亿美元。Modal平台为开发者提供GPU算力租用及无服务器基础设施,简化AI推理工作负载部署流程。受AI编程工具企业级应用爆发驱动,公司年收入已从9月的6000万美元增长至约3亿美元。
电网软件初创公司Texture完成1250万美元A轮融资,由VoLo Earth Ventures和Equal Ventures联合领投。随着电动车充电、数据中心及可再生能源带来的用电需求激增,电网压力日益突出。Texture平台可整合电表、电池、光伏、智能恒温器等多源数据,为运营商提供实时统一视图,帮助提前预警设备故障。公司主要面向服务约4200万美国用户的电力合作社,支持快速部署,无需替换现有系统。目前已与特斯拉、Honeywell等50余家厂商完成集成。
一项针对700名数据分析师和700名IT领导者的全球调查显示,96%的受访者已在工作中使用AI,但仅49%为高频用户。59%预计将在未来12个月内积极部署AI智能体,且逾半数愿意授予其"无限制"数据访问权限。电子表格仍是主流工具,占比61%。仅5%的组织支持实时决策。数据分析师每周花费近4小时验证AI输出结果,加上基础数据处理时间,AI相关工作已占用近两天工时。
芬兰智能戒指制造商Oura Health Oy已向美国证券交易委员会秘密提交IPO申请,具体股份数量和定价尚未披露。该公司去年10月完成9亿美元E轮融资后估值达110亿美元,2025年营收约10亿美元,同比翻倍。付费会员数本季度预计突破500万。目前智能戒指市场竞争加剧,三星、RingConn等品牌相继入局。Oura计划将IPO募资主要用于海外扩张及AI功能开发。
由Anthropic、黑石集团和Hellman & Friedman联合支持、总融资15亿美元的AI原生企业服务公司,宣布收购旧金山应用AI服务商Fractional AI。后者由三位前LiveRamp高管于2024年创立,专注于将生成式AI从试点推向企业生产环境落地。此次收购为新公司提供了现成的工程交付团队,将与Anthropic应用AI部门协同工作,重点服务医疗、制造、金融、零售等中型企业市场。
Workday公布第一季度财报,每股收益2.66美元超出华尔街预期,营收同比增长13%至25.4亿美元。公司上调全年调整后运营利润率至30.5%,股价盘后涨逾10%。创始人Bhusri重掌CEO后积极推进AI战略,其智能体AI产品Sana年化收入接近5亿美元,使用AI智能体的客户数量环比翻倍突破4000家。但分析师也指出,Workday面临Salesforce等竞争对手的压力,高昂部署成本与按用户定价模式或成潜在隐患。
SpaceX在IPO前的财务披露中将AI列为公司核心战略,预计其潜在市场规模高达26.5万亿美元。然而,旗下Grok聊天机器人市场表现疲软,付费用户占比仅0.174%,远落后于ChatGPT的6%。企业用户方面,Claude和Gemini增长迅猛,Grok仅从4%升至7%。SpaceX还披露了代号"Macrohard"的智能体AI平台及"Terafab"芯片制造计划,并着眼于部署百万颗卫星构建轨道数据中心。目前公司仍处于亏损状态,此次IPO将是关键融资机会。
Stellantis计划推出7款售价低于4万美元的Jeep、Ram和Chrysler新车,其中2款价格将低于3万美元。作为FaSTLAne 2030商业计划的一部分,该公司将在未来五年投资695亿美元用于增长和盈利。到2030年,Stellantis将推出60款新车,并对50款现有车型进行重大更新,涵盖纯电动、插电混动、混动及燃油车型。
捷尼赛思GV90将提供劳斯莱斯式对开门设计,向高端市场进军。这款基于Neolun概念车打造的全尺寸电动SUV预计2026年下半年上市,内饰采用全新Connect W信息娱乐系统和27英寸可滚动屏幕,搭载现代全新eM平台,续航里程较现有E-GMP平台提升50%。标准版起售价约10万美元,对开门版本售价可达20万美元。
中国锂业巨头赣锋锂业开始生产全球首款能量密度达500Wh/kg的10Ah固态电池。该公司是中国最大的锂化合物生产商,占据全球锂金属市场约45%份额,已与特斯拉、大众、现代等主要车企签订电池材料供应协议。赣锋同时推进硅基和锂金属两种固态电池技术路线,其中400Wh/kg硅基电池循环寿命已超1100次并具备量产条件。
iOS 27将于6月8日在WWDC大会上发布,有传言称该系统更新可能会放弃对四款iPhone机型的支持。微博爆料者Instant Digital上月发布了iOS 27支持机型的完整列表,其中iPhone 11、iPhone 11 Pro、iPhone 11 Pro Max和第二代iPhone SE四款能运行iOS 26的机型未出现在名单中。若消息属实,iOS 27将要求iPhone 12或更新机型才能运行。此外,iOS 27的许多核心功能预计将涉及Apple Intelligence,这需要iPhone 15 Pro或更高版本才能支持。
Google更新了"Android Bench"排行榜,评估AI模型在Android应用开发中的表现。最新数据显示,GPT 5.5成为最佳模型,领先GPT 5.4和Gemini 3.1 Pro约2%。此次更新还新增了平均延迟、token使用量和成本等指标。尽管GPT 5.5性能更强,但其成本是Gemini 3.1 Pro的两倍以上。榜单还纳入了更多开源模型,其中GLM 5.1得分最高。
AWS在其托管式生成式AI服务Amazon Bedrock中推出了高级提示词优化工具。该工具可自动优化提示词,提升多个大语言模型的准确性、一致性和效率。它通过评估、重写和基准测试帮助开发者找到最佳配置。分析师指出,随着企业将AI工作负载投入生产,推理成本和延迟成为关键问题,自动化提示词优化工具需求激增。
CIO深谙人员、流程和技术之间的相互依赖关系。如今,AI正在压缩这三个经典框架领域,挑战企业运营模式,推动CIO从技术导向转向更广泛的职责范围。专家强调,AI的规模化最终取决于人员、系统和工作流程。技术领导者需要思考技能投资方向、投资方式,以及如何帮助员工克服"被淘汰的恐惧"。企业应按1:3的比例投资技术与人才,重新定义所需技能集,并与高管团队合作确保员工获得适当的工具和培训。
研究发现主流推理大模型有41%—52%的推理内容是"废话",论文提出PUMA框架,通过语义冗余检测与答案验证双重机制,平均节省26.2%算力同时保持答案质量。