阿里云机器学习平台PAI论文入选 SIGMOD 2023

SIGMOD是数据库与数据管理系统领域的国际顶级会议，自1975年首次举办以来，一直对数据管理、存储和处理的发展起着深刻的推动作用，在学术和工业界均有巨大影响力。

近日，阿里云机器学习平台PAI和北京大学杨智老师团队合作的论文《GoldMiner: Elastic Scaling of Training Data Pre-Processing Pipelines for Deep Learning》被SIGMOD 2023录用。论文通过对深度学习数据预处理流水线的弹性伸缩，大幅提升了训练性能和集群资源利用效率。

SIGMOD是数据库与数据管理系统领域的国际顶级会议，自1975年首次举办以来，一直对数据管理、存储和处理的发展起着深刻的推动作用，在学术和工业界均有巨大影响力。SIGMOD也重视数据管理系统与其他方向的交叉，尤其近年来也对机器学习和人工智能领域格外关注。此次入选意味着阿里云机器学习平台PAI在深度学习数据处理方向达到了全球业界先进水平，获得了国际学者的认可，展现了中国机器学习系统技术创新在国际上的竞争力。

近年来，随着GPU加速器的不断进化，以及各类软件优化技术的层出不穷，深度学习训练的计算效率正不断被提升到新的层次。但与此同时，深度学习本质上仍是一种多阶段、多资源的任务类型：不仅需要在GPU上进行大量的训练计算，同时往往也需要CPU端的数据预处理流水线（如数据增强、特征转换等），这类预处理计算是训练出高质量模型的必要步骤。因此，GPU端训练性能的提升也带来了更大的数据预处理压力，使后者成为新的性能瓶颈。

针对这一问题，在观察后发现数据预处理流水线具有无状态的特点，具有内在的资源弹性。基于此，GoldMiner将数据预处理流水线和模型训练部分分离执行，通过自动计算图分析来识别无状态的数据预处理计算，并对其实现高效的并行加速和弹性伸缩，从而缓解数据预处理瓶颈，提升训练性能。通过与集群调度器的协同设计，GoldMiner进一步发挥了数据预处理计算的资源弹性，大幅提升集群调度效率。实验显示GoldMiner可提升训练性能最高达12.1倍，提升GPU集群利用率达2.5倍。

目前阿里云机器学习平台 PAI正在将GoldMiner与PAI-DLC集成，以向用户提供数据预处理加速能力。机器学习平台PAI面向企业客户及开发者，提供轻量化、高性价比的云原生机器学习，涵盖PAI-DSW交互式建模、PAI-Designer可视化建模、PAI-DLC分布式训练到PAI-EAS模型在线部署的全流程。其中PAI-DLC提供了云原生一站式的深度学习训练平台，提供灵活、稳定、易用和高性能的机器学习训练环境。支持多种算法框架，超大规模分布式深度学习任务运行及自定义算法框架，为开发者和企业降本增效。

论文名字：GoldMiner: Elastic Scaling of Training Data Pre-Processing Pipelines for Deep Learning论文作者：赵汉宇，杨智，程羽，田超，任仕儒，肖文聪，袁满，陈浪石，刘恺博，张杨，李永，林伟论文pdf链接：https://dl.acm.org/doi/pdf/10.1145/3589773

来源：业界供稿

阿里云

0赞

好文章，需要你的鼓励

阿里云机器学习平台PAI论文入选 SIGMOD 2023

来源：业界供稿

2023

06/21

13:18

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

阿里云李飞飞：将大模型，装进数据库里

国产软件再破记录！阿里云PolarDB数据库登顶TPC-C双榜第一

“数字中华”的1666天

在“云端”找步调，典名科技的“十年长跑”纪实

“双11”八年回响，“创云”创造下一个“云命题”

摘得“双11”首单，鼎峯云跨越9年顶峰相见

驻云科技的十年激荡云之路：我们在找更高“价值洼地”

双11七年“会战”，小牛云跨越山海

通义发布最强代码模型Qwen2.5-Coder，登顶全球开源代码模型王座

阿里云引领的SaaS进化论，AI加持的云端爆发

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: