最新文章
AI基础设施投资热潮的冷静思考

AI基础设施投资热潮的冷静思考

科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。

AI研究发现神经网络记忆与推理功能完全分离

AI研究发现神经网络记忆与推理功能完全分离

Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。

AI效率陷阱:黑暗启蒙如何重塑现实

AI效率陷阱:黑暗启蒙如何重塑现实

人工智能将效率推崇为最高价值,引发"黑暗启蒙"时代。AI系统开始从自身预测中学习,产生"现实漂移"现象,内在一致性超越外在准确性。企业追求AI驱动的效率提升,但往往只是优化了叙述而非智能。丹麦等国开始立法保护公民肖像权,对抗AI深伪技术。领导者需要重新引入智能摩擦,审视效率与学习的平衡,保护真实性基础设施。

创业公司将标签页混乱转化为创意"品味提速"工具

创业公司将标签页混乱转化为创意"品味提速"工具

初创公司First Concepts推出AI原生创意工作空间,通过浏览器扩展整合现有工具栈,帮助创意团队从需求到成品概念的速度提升70%。该系统统一团队简报、研究和灵感来源,利用AI编排工具同时保持人类创意主导权,实现"高速品味交付"。公司在AWS创业大赛中获胜,致力于为创意行业构建下一代基础设施。

Kaltura以2700万美元收购eSelf,后者创始人曾创立Snap AI技术

Kaltura以2700万美元收购eSelf,后者创始人曾创立Snap AI技术

纽约AI视频平台公司Kaltura宣布以约2700万美元收购以色列初创公司eSelf.ai。eSelf专注于开发能与用户对话的逼真数字虚拟人,支持30多种语言。该公司由Snap AI创始人Alan Bekker于2023年联合创立,拥有语音转视频生成和低延迟语音识别等核心技术。Kaltura计划将eSelf的虚拟代理技术整合到其视频产品中,为销售、营销、客服和培训等场景提供可嵌入的智能代理服务。这是Kaltura的第四次收购。

Salesforce AI团队首次构建70万页真实文档的RAG评测体系:揭示多模态检索增强生成的真实性能

Salesforce AI团队首次构建70万页真实文档的RAG评测体系:揭示多模态检索增强生成的真实性能

Salesforce AI研究团队构建了首个大规模多模态文档RAG评测基准UniDoc-Bench,包含7万页真实PDF文档和1600个问答对,覆盖8个领域。研究发现文本图像融合检索策略显著优于单一模态和联合多模态方法,为未来AI文档理解系统提供了"分工合作"的设计思路。

腾讯团队破解AI推理"探索枯竭"难题:低概率"推理火花"原来是关键

腾讯团队破解AI推理"探索枯竭"难题:低概率"推理火花"原来是关键

腾讯研究团队发现AI训练中"推理火花"现象,揭示低概率词汇如"等等"、"不过"等在维持AI探索能力中的关键作用。团队开发的低概率正则化方法通过精准保护有价值的低概率词汇,在数学推理任务中实现60.17%准确率,比传统方法提升2.66%,为AI创造性思维研究开辟新路径。

用手机拍个照就能重建整个3D世界?上海AI实验室让科幻变现实

用手机拍个照就能重建整个3D世界?上海AI实验室让科幻变现实

上海人工智能实验室联合多所高校开发的ARTDECO技术实现了仅用手机拍照就能实时重建高质量3D场景的突破。该系统巧妙结合AI模型的快速理解能力和传统几何算法的精确性,采用层次化高斯点云表示方法,在保证重建质量的同时实现了实时处理。实验显示该技术在多个数据集上超越现有方法,为虚拟现实、增强现实等应用领域带来革命性进展,有望让3D内容创作变得像拍照一样简单普及。

ByteDance团队突破图像视频编辑新边界:InstructX让AI真正"听懂"你的编辑需求

ByteDance团队突破图像视频编辑新边界:InstructX让AI真正"听懂"你的编辑需求

字节跳动团队发布的InstructX是首个统一处理图像和视频编辑的AI系统,能够理解自然语言指令并精确执行编辑任务。该系统创新性地发现仅通过图像训练就能自动获得视频编辑能力,有效解决了视频编辑数据稀缺问题。在多个评估基准上,InstructX超越了现有开源方法,在某些指标上可与商业解决方案媲美,为内容创作行业带来了新的可能性。

人大和上海AI实验室联手突破"记忆瓶颈":让AI像人类做笔记一样处理超长文本

人大和上海AI实验室联手突破"记忆瓶颈":让AI像人类做笔记一样处理超长文本

人大和上海AI实验室联合发布MemMamba架构,突破AI长文本处理的"记忆瓶颈"。该研究首次系统分析了主流AI模型的记忆衰减机制,提出模拟人类"做笔记"的解决方案。MemMamba在保持线性计算复杂度的同时,实现6万字长文本稳定处理,推理速度比Transformer提升48%,为超长序列AI应用开辟新路径。

谷歌推出私有AI计算云服务,声称与本地处理同样安全

谷歌推出私有AI计算云服务,声称与本地处理同样安全

谷歌发布新的私有AI计算云服务,旨在提供更强大的AI体验同时保护用户隐私。该服务基于谷歌定制TPU芯片和AMD可信执行环境,通过加密连接和内存隔离确保数据安全。谷歌称其安全性与本地处理相当,但云端算力更强,可运行更大规模的Gemini模型。该服务将为Magic Cue等AI功能提供支持,采用边缘与云端混合处理模式。

AI实施中的协调缺口:商业领袖必须解决的问题

AI实施中的协调缺口:商业领袖必须解决的问题

IBM研究显示,半数全球高管承认AI投资步伐过快导致技术碎片化。企业在部署生成式AI时缺乏统一规划,造成系统无法协同工作。过去三年仅25%的AI项目达到预期投资回报率,只有16%实现企业级扩展。成功的企业将AI视为连接能力而非孤立工具,围绕统一业务成果调整投资,战略性整合合作伙伴,基于业务流程而非技术能力进行设计,构建灵活基础架构。

OWASP 2025年度十大应用安全风险发布:访问控制缺陷仍居首位

OWASP 2025年度十大应用安全风险发布:访问控制缺陷仍居首位

开放式Web应用程序安全项目发布2025年十大应用风险清单,这是自2021年以来的首次更新。报告显示,访问控制缺陷依然是最大威胁,安全配置错误紧随其后,软件供应链问题仍然突出。新增了异常条件处理不当类别,服务器端请求伪造已合并到访问控制缺陷中。注入攻击从第三位降至第五位。

红帽发布OpenShift 4.20版本,强化AI、安全与虚拟化功能

红帽发布OpenShift 4.20版本,强化AI、安全与虚拟化功能

红帽发布OpenShift4.20企业Kubernetes平台,新增人工智能功能、增强平台安全性并扩展虚拟化选项。该版本支持量子抗性加密算法,保护关键通信免受量子计算威胁。同时推出vLLM语义路由器开源项目,通过智能路由优化大语言模型查询效率。新版本简化AI工作负载部署管理,扩展OpenShift Lightspeed虚拟助手功能,并改进虚拟化性能。

Pure Storage推出Data Stream:AI数据管道加速器

Pure Storage推出Data Stream:AI数据管道加速器

Pure Storage发布Data Stream,这是一个以GPU为中心的AI数据管道集成硬件软件堆栈。该解决方案运行在FlashBlade//S和英伟达Blackwell GPU硬件上,可自动化加速企业AI管道的数据摄取、转换和优化。Data Stream具备自动化实时数据摄取、英伟达NeMo集成、GPU优化管道加速等功能,支持多协议访问,可处理数十亿文件,通过在存储层执行并行转换大幅降低推理延迟,为企业AI应用提供即时访问优化数据的能力。

VAST数据推出支持谷歌云TPU的托管AI操作系统服务

VAST数据推出支持谷歌云TPU的托管AI操作系统服务

VAST Data与谷歌云宣布推出全托管VAST AI OS服务,提供支持谷歌TPU的跨混合环境统一全局命名空间。该AI OS整合了VAST完整软件栈,通过GPU服务器和网络硬件为AI模型提供训练、推理和智能交互环境。企业客户可无缝连接谷歌云和本地集群,消除复杂迁移过程。测试显示,该系统在美国TPU和日本GPU处理集群间实现近实时数据访问,模型加载速度与本地NVMe磁盘相当。

Qilimanjaro在欧洲开设首个多模态量子数据中心

Qilimanjaro在欧洲开设首个多模态量子数据中心

Qilimanjaro量子科技公司在西班牙巴塞罗那开设了号称欧洲首个多模态量子数据中心,准备提供基于云的量子计算服务。该设施将容纳多达10台量子计算机,为数千用户提供数字和模拟量子计算机访问服务,用于分子模拟、材料研究、AI模型训练和大规模优化问题求解。预计量子计算市场将从2025年的16亿美元增长到2030年的73亿美元。

AI发展速度已超越支撑网络基础设施

AI发展速度已超越支撑网络基础设施

人工智能正在深刻影响各行各业,但许多企业在AI转型过程中遭遇延迟、成本飙升等问题。根本原因在于传统企业网络无法支撑AI工作负载的需求。AI需要处理大量非结构化数据,依赖高性能计算集群和低延迟高吞吐量连接,常跨越混合云和多云架构。传统网络针对分支到数据中心流量优化,无法满足大规模GPU训练或多云推理扩展需求。企业必须优先解决网络问题,构建云优先、弹性可扩展的基础设施,确保网络不成为业务转型的限制因素。

高精度GPS技术首次在东南亚网约车应用中试点部署

高精度GPS技术首次在东南亚网约车应用中试点部署

网约车巨头Grab在新加坡启动高精度GPS试点项目,与Oppo、高通和Swift Navigation合作,在东南亚首次在手机端实现车道级定位精度。该系统结合双频GPS、高通骁龙8 Elite平台和云端校正服务,将定位误差从20米大幅降低。试点涉及近250名司机,其中60人配备Oppo Find N5折叠手机。技术可显著改善高楼密集区域和地下隧道的导航体验,为用户提供更准确的预计到达时间。

诺基亚贝尔实验室与KDDI合作研发6G节能技术

诺基亚贝尔实验室与KDDI合作研发6G节能技术

诺基亚贝尔实验室与日本运营商KDDI签署联合研究协议,探索提升6G网络能效和韧性的新方法。双方将结合KDDI的真实网络数据和运营洞察,以及诺基亚贝尔实验室的先进能耗模型和可编程网络架构专业知识,重点研究移动多输入多输出能效优化和分布式可编程核心网络服务,旨在降低基站能耗、增强通信能力,并确保基础设施故障和自然灾害期间的持续通信。