近日,阿里云机器学习PAI团队发布一键端侧超分工具,可实现在设备和网络带宽不变的情况下,将移动端视频分辨率提升1倍,最高可增强至1440p,将大幅提升终端用户的观看体验,该技术目前已在优酷、夸克、UC浏览器等多个APP中广泛应用。
观看上图不难发现,左侧画面和右侧画面的清晰度有极大差别。事实上,两侧画面的视频播放源完全相同,区别在于右侧画面使用了特殊的“一键超分”工具,从而实现清晰度从540p到1080p的华丽转身。
超分,即“超分辨率”,是指通过深度学习方式将低分辨率图片或视频的清晰度提高,获得更高分辨率,进而达到更好的观看体验和识别准确率。通过特殊的卷积神经网络(CNN)对已知的高分辨率资源进行学习,即可实现对任意低分辨率图像和视频资源进行超分处理的模型。
在移动互联网普及并成为主流的今天,用户对“上网冲浪”的体验愈加关注,更快速、更高清也成为APP开发者们不懈的追求。在“更高清”这个方向,纯软件化的优化方案——端侧超分进入开发者的视野:通过在手机、平板电脑等移动设备上运行超分算法,弥补设备硬件、网络带宽、原始素材等客观条件限制,进而获得高画质的图像和视频。但是,受制于端侧算力、设备兼容等问题,端侧超分方案规模化落地并不像想象中简单。
阿里云机器学习 PAI 团队近日发布搭载 PAI-AISR 模型的一键端侧超分工具,通过对模型进行量化剪枝等加速优化、以及对端侧多设备(CPU/GPU/NPU)进行异构计算和内存I/O优化等,具备以下优势:
对移动APP开发者来说,PAI端侧一键超分工具主要具备以下两点价值。首先,使用端侧超分可以减少数据下发过程中CDN的消耗,实现降本提效。其次,当客户端网络不稳定或者带宽受限(例如处于3G状态下,或者处于地铁、电梯等信号不稳定的环境中),导致视频播放卡顿时,端侧超分技术可以让终端用户的浏览体验更顺滑。同时由于整个推理过程在端侧进行,避免了云端推理成本高、时延长等问题的出现。
目前,PAI一键端侧超分方案已经在优酷、夸克、UC浏览器等多个移动应用成功落地,在不断提升终端用户体验的同时,带来应用研发效率的提升。
好文章,需要你的鼓励
微软在Ignite 2025大会上预览了Windows的重要更新,显示出操作系统向支持AI智能体的根本性转变。新增功能包括原生支持模型上下文协议(MCP)、智能体连接器注册表、明确的权限管控模型,以及独立的智能体工作空间。这些更新建立了OS级别的身份验证、授权和审计机制,让智能体能够安全地执行文件操作和系统设置等任务,同时保持可控性和可追溯性。
华为诺亚实验室等机构联合提出了一种创新的AI训练方法,通过双层优化框架让AI从数据中自动学习评价标准。该方法结合了传统最大似然估计和强化学习的优势,在表格分类和模型驱动强化学习任务中展现出更好的收敛性和泛化能力,为解决强化学习中缺乏明确奖励信号的问题提供了新思路。
苹果即将发布的macOS Tahoe 26.2系统将支持通过雷雳5连接多台Mac设备,构建低延迟AI超算集群。该功能支持Mac Studio、M4 Pro Mac mini和MacBook Pro等设备。四台Mac Studio可高效运行万亿参数的Kimi-K2-Thinking模型,功耗不到500瓦,比传统GPU集群低10倍。此外,MLX项目将获得M5芯片神经加速器的完整访问权限。
中科院自动化所团队发布AVoCaDO系统,这是首个能精准捕捉视听事件时间同步关系的AI视频解说生成器。通过双阶段训练和创新奖励机制,AVoCaDO不仅能识别视频内容,更能准确把握各元素的时间关系,在多个基准测试中显著超越现有开源模型,甚至在某些指标上超过商业模型,为智能视频理解开辟新方向。