阿里云机器学习平台PAI与华东师范大学论文入选SIGIR 2022

近日，阿里云机器学习平台PAI与华东师范大学高明教授团队合作的论文《结构感知的稀疏注意力Transformer模型SASA》被顶会 SIGIR 2022录取。

近日，阿里云机器学习平台PAI与华东师范大学高明教授团队合作的论文《结构感知的稀疏注意力Transformer模型SASA》被顶会 SIGIR 2022录取。论文主导通过引入稀疏自注意力的方式来提高Transformer模型处理长序列的效率和性能，并提出了结合代码语言和结构特性的面向长代码序列的Transformer模型性能优化方法。

SIGIR是人工智能领域智能信息检索方向顶级国际会议，涉及搜索引擎、推荐系统等多个方向，该会议曾推动了面向搜索的排序模型、基于深度学习的推荐算法等人工智能领域的核心创新，在学术和工业界都有巨大的影响力。此次入选意味着阿里云机器学习平台PAI自研的稀疏注意力Transformer模型达到了业界先进水平，获得了国际学者的认可，展现了中国机器学习系统技术创新在国际上的竞争力。

那么SASA主要解决了什么问题？基于Transformer的模型在self-attention模块的复杂度随序列长度呈次方增长，多数编程预训练语言模型（Programming-based Pretrained Language Models, PPLM）采用序列截断的方式处理代码序列，从而导致上下文信息缺失。

针对以上问题，SASA设计了四种稀疏注意力模式，包括：sliding window attention，global attention，Top-k attention，AST-aware attention，在一定程度上将计算复杂度与序列长度解耦。其中sliding window和Top-k模式基于局部上下文和重要的attention交互学习表示，抽象语法树（AST）模式引入代码的结构特性，与序列上下文信息相互补足，global attention通过与序列中所有token进行交互来获取全局信息。对比CodeBERT，GraphCodeBERT等方法，SASA在多个长代码任务上取得最佳效果，同时也降低了内存和计算复杂度。

SASA技术将在开源框架EasyNLP中集成，给PAI的NLP开发者提供基于稀疏注意力机制的长序列自然语言处理能力。机器学习平台PAI面向企业客户级开发者，提供轻量化、高性价比的云原生机器学习，涵盖PAI-DSW交互式建模、PAI-Designer可视化建模、PAI-DLC分布式训练到PAI-EAS模型在线部署的全流程。

论文信息

EasyNLP开源地址：https://github.com/alibaba/EasyNLP

论文链接：https://arxiv.org/abs/2205.13730
论文名字
Understanding Long Programming Languages with Structure-Aware Sparse Attention. SIGIR 2022
论文作者
刘婷婷，汪诚愚，陈岑，高明，周傲英

来源：业界供稿

阿里云

0赞

好文章，需要你的鼓励

阿里云机器学习平台PAI与华东师范大学论文入选SIGIR 2022

来源：业界供稿

2022

07/11

17:46

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

阿里云李飞飞：将大模型，装进数据库里

国产软件再破记录！阿里云PolarDB数据库登顶TPC-C双榜第一

“数字中华”的1666天

在“云端”找步调，典名科技的“十年长跑”纪实

“双11”八年回响，“创云”创造下一个“云命题”

摘得“双11”首单，鼎峯云跨越9年顶峰相见

驻云科技的十年激荡云之路：我们在找更高“价值洼地”

双11七年“会战”，小牛云跨越山海

通义发布最强代码模型Qwen2.5-Coder，登顶全球开源代码模型王座

阿里云引领的SaaS进化论，AI加持的云端爆发

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: