/

阿里云 EasyNLP 跨模态学习能力再升级，电商文图检索效果刷新SOTA

近日，阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布，推出了融合了丰富电商场景知识的CLIP模型，在电商文图检索效果上刷新了SOTA结果，并且将上述模型免费开源，贡献给开源社区。

近日，阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布，推出了融合了丰富电商场景知识的CLIP模型，在电商文图检索效果上刷新了SOTA结果，并且将上述模型免费开源，贡献给开源社区。

CLIP（Contrastive Language-Image Pre-training）是一种经典的文图跨模态检索模型，它在大规模图文数据集上进行了对比学习预训练，具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构，构建基于CLIP包含图像和文本Encoder两部分的双流模型，同时基于商品数据，以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集，以Fashion-Gen数据集为例，EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明，相比于现公布的SOTA模型（CommerceMM），电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升，评测指标最高提升了8.7～15个百分点。

除此之外，电商base模型在文到图与CommerceMM相当检索结果下，使用了更少的参数量。由此可见，电商CLIP无论在large还是base图像Encoder的设置下，都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

阿里云 EasyNLP 跨模态学习能力再升级，电商文图检索效果刷新SOTA

图到文检索评测结果

阿里云 EasyNLP 跨模态学习能力再升级，电商文图检索效果刷新SOTA

目前，电商CLIP可在EasyNLP中直接安装使用，在未来，EasyNLP框架会集成更多NLP的多模态的知识模型，覆盖各个常见领域和任务，同时也将集成更多SOTA模型（特别是中文模型），来支持各种NLP和多模态任务，共建NLP和多模态算法库。

Github地址：https://github.com/alibaba/EasyNLP

来源：业界供稿

阿里云

0赞

好文章，需要你的鼓励

推荐文章

诺奖得主辛顿：20年内超级智能会比我们更聪明，人类想生存只能成为被AI照顾的“婴儿”

2025-11-03

诺奖得主辛顿：20年内超级智能会比我们更聪明，人类想生存只能成为被AI照顾的“婴儿”

2024年10月8日，Geoffrey Hinton（杰弗里·辛顿）因在人工神经网络领域的开创性工作获得诺贝尔物理学奖。

NVIDIA推出ChronoEdit：让AI图像编辑拥有物理常识的革命性技术

人工智能

图像编辑

视频生成

2025-11-03

NVIDIA推出ChronoEdit：让AI图像编辑拥有物理常识的革命性技术

NVIDIA联合多伦多大学开发的ChronoEdit系统通过将图像编辑重新定义为视频生成问题，让AI具备了物理常识。该系统引入时间推理机制，能够想象编辑的完整变化过程，确保结果符合物理规律。在专业测试中，ChronoEdit超越了所有开源竞争对手，特别在需要物理一致性的场景中表现突出，为自动驾驶、机器人等领域的应用提供了重要技术突破。

月之暗面AI模型注意力机制新突破：让AI更聪明更快的“记忆管理术“

2025-11-03

月之暗面AI模型注意力机制新突破：让AI更聪明更快的“记忆管理术“

月之暗面AI模型注意力机制新突破：让AI更聪明更快的"记忆管理术"

AI推理新突破：乔治亚大学团队让大型语言模型学会“精打细算“的思考方式

人工智能

树搜索推理

信息论优化

2025-11-03

AI推理新突破：乔治亚大学团队让大型语言模型学会“精打细算“的思考方式

这项研究提出了MITS框架，使用信息论中的点互信息指导AI推理过程，解决了传统树搜索方法计算成本高、评估标准模糊的问题。通过动态采样和加权投票机制，MITS在多个推理数据集上显著超越现有方法，同时保持高效的计算性能，为AI推理技术开辟了新方向。

2022

09/27

10:19

分享

点赞

最新文章

相关文章

邮件订阅

AI启示录

更多

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

业界热点:

数字化转型

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号京网文(2025) 0096-033号京字第20868号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　公开举报受理处置规则

网上有害信息举报专区：https://www.12377.cn

安全联盟认证