近日,阿里巴巴宣布加入Linux Foundation AI&Data基金会,持续加大对AI和大数据技术的投入以促进相关开源建设。
阿里巴巴是Linux的活跃开发者,此前已经为Linux内核提交了290多个Patch。除了Linux之外,阿里巴巴在MySQL、JVM、Web服务器等知名项目中均有杰出贡献,也是开源组织WebScaleSQL的5大成员之一。
阿里云机器学习平台PAI和大数据平台技术负责人林伟表示:“加入Linux Foundation AI&Data基金会有助于阿里巴巴更加深入地理解LF AI&Data,更多地参与到技术与标准制定讨论当中,主动把握未来大数据和AI发展方向”。
此次,在加入Linux Foundation AI&Data基金会的同时,阿里巴巴也积极地回馈社区,将面向推荐场景的高性能深度学习框架DeepRec捐赠给Linux Foundation AI&Data基金会托管。
DeepRec 是阿里云机器学习平台 PAI 开源的面向推荐场景的高性能深度学习框架,针对稀疏模型在分布式、图优化、算子、Runtime 等方面进行了深度的性能优化,同时提供了搜索、推荐、广告场景下特有的动态弹性特征,动态弹性维度,自适应 EmbeddingVariable、增量模型导出及加载等一系列功能。
DeepRec在阿里巴巴集团内部广泛应用于淘宝、天猫、阿里妈妈、高德、淘特、AliExpress、Lazada等,支持了淘宝搜索、推荐、广告等核心业务,支撑着千亿特征、万亿样本的超大规模稀疏训练。DeepRec开源一年多以来,已经在数十家公司的搜推广业务场景中大规模应用,带来了巨大的业务价值。
Linux Foundation AI&Data基金会执行董事Ibrahim Haddad博士对此表示热烈欢迎,“DeepRec凭借其在深度学习推荐框架方面令人印象深刻的成果,为技术项目带来创新的解决方案。很高兴与DeepRec合作进一步开发和增强这一强大的开源技术。借助Linux Foundation AI&Data基金会的专业知识和资源,携手共进一同推动深度学习的进步,并彻底改变处理推荐系统的方式。”
阿里巴巴在DeepRec捐赠后,将继续和LFAI&Data一起持续维护和推广DeepRec,打造面向搜推广场景的深度学习框架生态,吸引更多的公司和团队参与到DeepRec使用和开发中来。此外阿里巴巴将会更加积极开放地参与到更多的开源基金会,并将在适当时候捐献部分软件项目给基金会托管。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。