6 月 1 日在阿里云粤港澳大湾区云峰会上,阿里云智能云原生应用平台总经理丁宇宣布,Serverless 容器服务 ASK全面升级,进一步帮助企业和开发者降本提效。
Gartner 曾预测,2023 年 70% 的 AI 应用将基于容器和 Serverless 技术开发。作为云原生的重要技术组成,K8s 已经被开发者和企业广泛认可,然而其自身复杂性和陡峭的学习曲线依然让人望而生畏。
阿里云在 2018 年发布了首个Serverless容器服务ASK,其本质是将容器的运行时和具体的节点运行环境解耦,让用户无需管理K8s节点和服务器,即可直接部署应用,大幅降低容器服务的使用门槛。目前,ASK在容器化应用、在线业务弹性、AI/大数据计算类任务等场景中被广泛使用。
此次 ASK 的全新升级,进一步整合了阿里云基础设施的能力,在使用成本、创建效率、异构资源兼容、弹性供给保障等方面带来显著提升,解决开发者在使用K8s的复杂性挑战,也顺应了 AI场景爆发下催生的新需求。
丁宇介绍,本次ASK升级涵盖了多个维度,包括对组件的全托管支持、AI镜像的秒级拉取能力,还降低了客户的使用成本。具体来说:
1、组件全托管,零K8s运维成本
ASK新增对 CoreDNS、Metrics Server 等十多个 K8s 核心组件的托管支持,提供动态容量规划能力,客户无需自行部署维护,最大化降低运维复杂度。同时,ASK也新增了智能化风险识别能力,支持自动化升级K8s版本,避免升级导致的应用故障或异常风险。
2、极致弹性,准确率提升80%
ASK 提供首界首创基于容器镜像缓存的 AI 大镜像秒级拉取能力,AI 应用启动时间降低90%。并且提供端到端的弹性加速,面向AI/大数据工作负载容器化进行全栈优化,通过数据集加速提升 30% 访问性能;此外,本次 ASK 还增强了智能弹性预测 AHPA能力,相比人工配置,弹性准确率提升 80%;同时新增对于 GPU 的支持。
3、普惠算力,性价比提升40%
为了给客户提供更好的服务,释放技术红利,让算力更普惠,ASK新增U实例规格支持,统一支持多款处理器,相比上一代主售实例降价高达40%。新增SavingPlan弹性版本,面向应用非固定波峰波谷场景,额外成本优化10%以上。为进一步让价格更透明,新增成本套件支持,清晰洞察弹性资源成本,让成本治理更便捷。
以数禾科技为例,这是一家为金融机构提供高效的智能零售金融解决方案的公司,对于模型的计算能力包括计算速度、计算结果准确性、计算数据实时性等,有很高的要求。而当前的困扰是支撑模型计算的底层应用资源无法根据请求量来调整机器资源支持运算能力,这也是当前业务快速发展过程中亟待解决的痛点。同时,随着模型在线推理服务数量的增加,数禾的模型服务也变得越来越庞大、臃肿,难以管理。这种状况不仅导致了资源浪费,还增加了维护和升级的成本。
为了解决这些“顽疾”,数禾科技采用阿里云 ASK 部署线上模型,无需 K8s 节点管理,根据实时流量动态使用 POD,资源成本节省60%;通过 ASK Knative 服务,解决了数禾模型的灰度发布和多版本并存问题;得益于ASK 自动伸缩和缩容到 0 的优势,降低运行成本,大幅提升服务可用性。
“使用阿里云容器服务 Knative 和 ECI 虚拟节点配合部署,保证线上模型应对突发流量的稳定性提升的同时,又使资源利用效率显著提高,极大地节约了资源成本。”数禾科技 AI 实验室 AI 平台负责人周伟鹏表示。
目前,ASK 已加入阿里云飞天免费试用计划,为开发者、企业提供一定额度的免费试用资源。3分钟就可以创建Kubernetes集群,开启容器弹性之旅。
好文章,需要你的鼓励
OpenAI 本周为 ChatGPT 添加了 AI 图像生成功能,用户可直接在对话中创建图像。由于使用量激增,CEO Sam Altman 表示公司的 GPU "正在融化",不得不临时限制使用频率。新功能支持工作相关图像创建,如信息图表等,但在图像编辑精确度等方面仍存在限制。值得注意的是,大量用户正在使用该功能创作吉卜力动画风格的图像。
Synopsys 近期推出了一系列基于 AMD 最新芯片的硬件辅助验证和虚拟原型设计工具,包括 HAPS-200 原型系统和 ZeBu-200 仿真系统,以及面向 Arm 硬件的 Virtualizer 原生执行套件。这些创新工具显著提升了芯片设计和软件开发的效率,有助于加快产品上市速度,满足当前 AI 时代下快速迭代的需求。
人工智能正在深刻改变企业客户关系管理 (CRM) 的方方面面。从销售自动化、营销内容生成到客服智能化,AI不仅提升了运营效率,还带来了全新的服务模式。特别是自主代理AI (Agentic AI) 的出现,有望在多渠道无缝接管客户服务职能,开创CRM发展新纪元。
数据孤岛长期困扰着组织,影响着人工智能的可靠性。它们导致信息分散、模型训练不完整、洞察力不一致。解决方案包括实施强大的数据治理、促进跨部门协作、采用现代数据集成技术等。克服数据孤岛对于充分发挥AI潜力至关重要。