6 月 1 日在阿里云粤港澳大湾区云峰会上,阿里云智能云原生应用平台总经理丁宇宣布,Serverless 容器服务 ASK全面升级,进一步帮助企业和开发者降本提效。

Gartner 曾预测,2023 年 70% 的 AI 应用将基于容器和 Serverless 技术开发。作为云原生的重要技术组成,K8s 已经被开发者和企业广泛认可,然而其自身复杂性和陡峭的学习曲线依然让人望而生畏。
阿里云在 2018 年发布了首个Serverless容器服务ASK,其本质是将容器的运行时和具体的节点运行环境解耦,让用户无需管理K8s节点和服务器,即可直接部署应用,大幅降低容器服务的使用门槛。目前,ASK在容器化应用、在线业务弹性、AI/大数据计算类任务等场景中被广泛使用。
此次 ASK 的全新升级,进一步整合了阿里云基础设施的能力,在使用成本、创建效率、异构资源兼容、弹性供给保障等方面带来显著提升,解决开发者在使用K8s的复杂性挑战,也顺应了 AI场景爆发下催生的新需求。
丁宇介绍,本次ASK升级涵盖了多个维度,包括对组件的全托管支持、AI镜像的秒级拉取能力,还降低了客户的使用成本。具体来说:
1、组件全托管,零K8s运维成本
ASK新增对 CoreDNS、Metrics Server 等十多个 K8s 核心组件的托管支持,提供动态容量规划能力,客户无需自行部署维护,最大化降低运维复杂度。同时,ASK也新增了智能化风险识别能力,支持自动化升级K8s版本,避免升级导致的应用故障或异常风险。
2、极致弹性,准确率提升80%
ASK 提供首界首创基于容器镜像缓存的 AI 大镜像秒级拉取能力,AI 应用启动时间降低90%。并且提供端到端的弹性加速,面向AI/大数据工作负载容器化进行全栈优化,通过数据集加速提升 30% 访问性能;此外,本次 ASK 还增强了智能弹性预测 AHPA能力,相比人工配置,弹性准确率提升 80%;同时新增对于 GPU 的支持。
3、普惠算力,性价比提升40%
为了给客户提供更好的服务,释放技术红利,让算力更普惠,ASK新增U实例规格支持,统一支持多款处理器,相比上一代主售实例降价高达40%。新增SavingPlan弹性版本,面向应用非固定波峰波谷场景,额外成本优化10%以上。为进一步让价格更透明,新增成本套件支持,清晰洞察弹性资源成本,让成本治理更便捷。

以数禾科技为例,这是一家为金融机构提供高效的智能零售金融解决方案的公司,对于模型的计算能力包括计算速度、计算结果准确性、计算数据实时性等,有很高的要求。而当前的困扰是支撑模型计算的底层应用资源无法根据请求量来调整机器资源支持运算能力,这也是当前业务快速发展过程中亟待解决的痛点。同时,随着模型在线推理服务数量的增加,数禾的模型服务也变得越来越庞大、臃肿,难以管理。这种状况不仅导致了资源浪费,还增加了维护和升级的成本。
为了解决这些“顽疾”,数禾科技采用阿里云 ASK 部署线上模型,无需 K8s 节点管理,根据实时流量动态使用 POD,资源成本节省60%;通过 ASK Knative 服务,解决了数禾模型的灰度发布和多版本并存问题;得益于ASK 自动伸缩和缩容到 0 的优势,降低运行成本,大幅提升服务可用性。
“使用阿里云容器服务 Knative 和 ECI 虚拟节点配合部署,保证线上模型应对突发流量的稳定性提升的同时,又使资源利用效率显著提高,极大地节约了资源成本。”数禾科技 AI 实验室 AI 平台负责人周伟鹏表示。
目前,ASK 已加入阿里云飞天免费试用计划,为开发者、企业提供一定额度的免费试用资源。3分钟就可以创建Kubernetes集群,开启容器弹性之旅。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。