全球领先的开源解决方案提供商红帽公司近日宣布正式发布红帽OpenShift Lightspeed。该产品是一款基于生成式AI(gen AI)的虚拟助手,已集成至红帽OpenShift。
2025Inclusion·外滩大会创新者舞台公开征集创新项目,企业、团体、个人皆可报名。
旅游预订巨头Kayak和Expedia正在开发基于AI的智能旅行助手,能够将社交媒体内容转化为实际行程。Kayak推出了基于ChatGPT的AI聊天助手,提供个性化旅行规划服务。Expedia则发布了Trip Matching功能,用户可发送Instagram旅行视频,系统自动生成相应行程。两家公司都强调在为用户提供便捷体验的同时,需要平衡用户控制权与AI代理的自主性,利用海量数据为"搜索型"用户简化复杂的旅行规划流程。
传统大型在线零售商的时代即将结束。OpenAI、Gemini等AI助手正在重新定义购物方式,消费者不再从零售商主页开始购物之旅。AI成为策展人和购物向导后,传统数字商城将面临死亡。这与十年前社交媒体颠覆新闻媒体的情况相似。零售商需要采用三种生存策略:价格领导、物流网络优势,以及内容咨询领导。未来将属于那些拥抱专业化、个性化和咨询能力的品牌。
香港大学团队开发了MiCo多图对比框架,通过自监督学习让AI学会像人类一样比较多张图片的细微差异。该方法无需人工标注,仅使用图像内在约束作为监督信号,在多项视觉理解测试中超越了GPT-4o等先进模型,为解决AI多图推理难题提供了新思路。
这项由伊利诺伊大学香槟分校研究团队开发的突破性AI技术,首次让机器具备了类似人类的空间推理能力。通过创新的细粒度偏好优化训练方法,SpatialReasoner-R1不仅能准确判断图片中的空间关系,还能提供完整的逻辑推理过程。在空间质量和数量任务上分别实现4.1%和9.0%的性能提升,为自动驾驶、机器人导航、增强现实等领域带来重要应用前景。
香港科技大学团队提出噪声一致性训练(NCT),这是首个专为一步生成器设计的原生控制添加方法。NCT通过在噪声空间进行一致性训练和边界约束,无需重新训练基础模型即可为预训练的一步生成器添加新的控制能力。实验显示该方法在保持生成质量的同时将速度提升50倍,在多种控制任务上超越传统方法,为AI图像生成的实用化提供了重要突破。
南开大学团队开发的LLaVA-Scissor技术通过创新的"语义连通组件"算法,实现了视频AI理解的高效压缩。该技术采用两步时空压缩策略,在保持99.7%准确率的同时将计算量减半,为解决视频AI系统计算瓶颈提供了突破性方案。
伊利诺伊大学研究团队开发出"生成式积木世界"系统,通过将照片分解成3D几何积木,让用户能够直观地编辑图像中物体的位置、大小和角度,同时保持原有质感。该技术突破了传统图像编辑在3D空间操作上的限制,为专业设计和普通用户提供了全新的创作工具。
NewsBreak团队与伊利诺伊大学合作开发DuaShepherd,这是一个创新的AI数学推理奖励模型。该系统独创性地结合了两种评估维度:步骤正确性判断和解题潜力评估,通过多任务学习和复合概率融合,在MATH500和ProcessBench测试中显著超越传统单一奖励模型,为AI数学推理提供了新的技术路径。
谷歌正准备将YouTube Create视频编辑应用带到iOS设备,距离该应用在Android平台独家发布已近两年。招聘信息显示,谷歌正在印度积极招聘工程师开发iOS版本。尽管YouTube Create提供免费移动视频编辑工具,但在与ByteDance的剪映和InShot的竞争中明显落后。数据显示,剪映第二季度Android下载量达6600万次,而YouTube Create仅不到50万次。
伊利诺伊大学团队开发了PhysRig系统,突破传统角色动画技术局限。该系统通过嵌入真实物理原理,将虚拟角色建模为具有弹性材料特性的立体结构,解决了传统线性混合蒙皮技术中的体积变形、不自然弯曲等问题。研究创新性地提出材料原型概念,大幅降低参数学习复杂度,在多项评估中显著优于传统方法,为动画制作、游戏开发和虚拟现实应用提供了更真实的角色动画解决方案。
大湾区大学研究团队开发的FairyGen系统能够将儿童简笔画转换为完整动画故事。该系统通过智能故事规划、风格传播适配器和3D重建技术,让画中角色"活"起来并保持原画艺术风格。采用两阶段训练策略分离身份与运动学习,实现自然流畅的动画效果,为创意教育和个性化内容创作开辟新途径。
总部位于达拉斯的初创公司Databahn成立于2023年,专注于通过AI智能体分析大量日志遥测数据来诊断安全威胁。该公司开发了Cruz AI智能体,可自动化处理日志发现、数据规范化、转换优化等流程。公司推出Reef产品来摄取PB级日志数据,实时过滤和优先处理高价值数据。近期获得1700万美元A轮融资,总融资额达1900万美元,将用于开发自主智能体和全球扩张。
采购软件初创公司Levelpath完成5500万美元B轮融资,由Battery Ventures领投。该公司由Scout RFP创始人Stan Garber和Alex Yakubovich创立,后者曾以5.4亿美元被Workday收购。Levelpath打造移动优先的用户友好平台,并从创立之初就集成AI能力,可审查合同中的非结构化数据并推荐更便宜的类似产品服务。目前客户包括Ace Hardware、安进等知名企业。
从“战AI智能体”到本地私有部署,惠普在中国全面推进商用AI PC落地,为千行百业打造真正可用的AI体验。
通义实验室已推出语音生成大模型 Cosyvoice、端到端音频多模态大模型MinMo等模型,全面覆盖语音合成、音频生成、音频理解等场景。
这项由中国移动和Zero Gravity实验室合作的研究成功突破了大模型训练的网络带宽限制,首次实现在1Gbps网络下训练1070亿参数模型,速度比传统方法快357倍。通过流水线并行、延迟重叠机制和自适应压缩算法的创新组合,为分布式AI训练开辟了新可能。
这项研究介绍了MADrive系统,一种革命性的自动驾驶场景模拟技术。该系统通过一个包含7万辆真实车辆的数据库,能够将普通驾驶录像转换成各种危险场景的高逼真度模拟,为自动驾驶系统提供安全的训练环境。实验表明,相比传统方法,MADrive在多个关键性能指标上都有显著提升,为解决自动驾驶训练数据稀缺问题提供了新思路。