
8月5日,在2022阿里云生命科学与智能计算峰会上,阿里云高性能计算研发负责人何万青发布了《生命科学行业云上解决方案及最佳实践》白皮书,同时推出高性能容器、大内存、高IO等三大高性能计算解决方案,满足基因测序与AI制药领域中海量级数据分析、作业流程与环境各异等场景需求。
生命科学行业发展至今,早已离不开高性能计算(High Performance Computing)的辅助,从计算机辅助药物设计、疫苗研发,到通过基因检测提供精准医疗服务、产前筛查等,高性能计算HPC在生命科学研究中扮演着十分重要的角色。
随着云计算技术服务及实践的日趋成熟,越来越多的行业通过上云实现了整个产业的转型升级,正处于黄金时期的生命科学行业也不例外。然而,目前针对生命科学行业的解决方案大部分都为线下IDC超算集群方案,随着基因组学、生物制药技术的不断演进及计算机科学的不断发展,传统计算机集群资源已无法满足生命科学行业及技术演进的需求。
本次发布的《生命科学行业云上解决方案及最佳实践》白皮书指出,生命科学企业的 IT 基础设施主要面临资源规模固定、建设周期长和硬件资源运维成本高三大问题。同时生命科学行业也希望拥抱公共云架构、使用异构计算与人工智能等新技术。
何万青表示,云上高性能计算是目前HPC建设使用的最佳途径。
在原来公共云与混合云两大解决方案的基础上,针对生命科学行业的不同需求,阿里云在该白皮书中新发布了高性能容器、大内存、高IO等三大高性能计算解决方案,共计五大解决方案:
1.公共云解决方案:提供一套通用的公共云架构的解决方案,满足用户快速便捷使用云上 HPC 服务的需求,并基于业务的高峰和低谷动态进行计算资源的弹性扩缩容,有效节省业务成本。方案尤其适用于快速发展的生命科学企业。
2.混合云架构解决方案:部分企业拥有线下 IDC 数据中心,但基础设施偏旧。随着业务的快速增长,希望可以使用阿里云 E-HPC 提供的强劲新算力,同时利旧IDC数据中心资源。这种情况可用混合云架构统一管理云上云下资源,与公共云打通,支持弹性扩缩容。企业可按需选择管理节点设置在云上或云下。
3.HPC+AI 的高性能容器方案:适用于药物研发和业务流程复杂多样的生信业务,涉及应用版本众多、依赖环境复杂,不同的工作流可能基于不同的操作系统和编译器构建。阿里云E-HPC高性能容器应用eStack可让使用多种软件栈的生信应用运行在同一个平台,便捷管理,支持多种调度器和底层资源,兼容性非常高。
4.生信行业应用大内存解决方案:阿里云与合作伙伴 Memverge 联合推出,适用于需要进行海量数据分析的业务,如基因测序中每个细胞的表达量数据高达数十万条读取 (reads),这种海量级的数据分析需要大内存容量。使用部署 MemVerge Memory Machine 软件的 ECS i4p 实例作为计算节点,可满足业务对性能的极致要求,同时阿里云E-HPC可自动纳管所有节点。
5.生信行业应用高 IO 解决方案:基因组织学研究产生的数据增长快速且需永久保存,要求存储系统具有海量容量及高扩展性。另外,基因研究应用软件种类众多,部分计算任务对 IO 吞吐要求很高。对此,阿里云与合作伙伴联科集团联合推出生信行业应用高 IO 解决方案。
上述解决方案可以覆盖生命科学行业的绝大多数场景与需求,拥有覆盖全球的丰富算力,极致性能,弹性伸缩能力帮助客户降本提效,管控可视化帮助用户省心运维等优势。目前,阿里云高性能计算广泛应用于工业仿真(CAD/CAE)、芯片设计(EDA)、生物医药材料、能源勘探与公共服务等多个行业。
深势科技利用弹性供应的成本优化策略,结合抢占式实例的价格,以30%的成本完成海量资源的交付。同时云上弹性高性能计算E-HPC自动运维的特性,降低了深势科技的运维成本,提升了集群管理效率。
生命医学企业圣庭医疗通过上云优化了传统IDC集群的数据可靠性、运维成本及效率问题,基因比对与分析效率提升了70%。阿里云高性能计算团队还通过结合Slurm业务工作流dependency与自动伸缩的结合,减少了无效的计算资源浪费,有效降低了使用成本。
在本次峰会上,天池大赛-“创新大师杯冷冻电镜蛋白质结构建模大赛”颁奖典礼也同期举行,全球近2000名参赛者一同探索云计算与蛋白质研究的前沿课题,大赛全程从阿里云E-HPC平台、英特尔第三代至强可扩展处理器(Cooper Lake)、深度学习加速和增强型AVX-512指令集等软硬件结合的角度进行全程辅导和训练,推动全行业对人才培养的持续关注。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。