8月5日,在2022阿里云生命科学与智能计算峰会上,阿里云高性能计算研发负责人何万青发布了《生命科学行业云上解决方案及最佳实践》白皮书,同时推出高性能容器、大内存、高IO等三大高性能计算解决方案,满足基因测序与AI制药领域中海量级数据分析、作业流程与环境各异等场景需求。
生命科学行业发展至今,早已离不开高性能计算(High Performance Computing)的辅助,从计算机辅助药物设计、疫苗研发,到通过基因检测提供精准医疗服务、产前筛查等,高性能计算HPC在生命科学研究中扮演着十分重要的角色。
随着云计算技术服务及实践的日趋成熟,越来越多的行业通过上云实现了整个产业的转型升级,正处于黄金时期的生命科学行业也不例外。然而,目前针对生命科学行业的解决方案大部分都为线下IDC超算集群方案,随着基因组学、生物制药技术的不断演进及计算机科学的不断发展,传统计算机集群资源已无法满足生命科学行业及技术演进的需求。
本次发布的《生命科学行业云上解决方案及最佳实践》白皮书指出,生命科学企业的 IT 基础设施主要面临资源规模固定、建设周期长和硬件资源运维成本高三大问题。同时生命科学行业也希望拥抱公共云架构、使用异构计算与人工智能等新技术。
何万青表示,云上高性能计算是目前HPC建设使用的最佳途径。
在原来公共云与混合云两大解决方案的基础上,针对生命科学行业的不同需求,阿里云在该白皮书中新发布了高性能容器、大内存、高IO等三大高性能计算解决方案,共计五大解决方案:
1.公共云解决方案:提供一套通用的公共云架构的解决方案,满足用户快速便捷使用云上 HPC 服务的需求,并基于业务的高峰和低谷动态进行计算资源的弹性扩缩容,有效节省业务成本。方案尤其适用于快速发展的生命科学企业。
2.混合云架构解决方案:部分企业拥有线下 IDC 数据中心,但基础设施偏旧。随着业务的快速增长,希望可以使用阿里云 E-HPC 提供的强劲新算力,同时利旧IDC数据中心资源。这种情况可用混合云架构统一管理云上云下资源,与公共云打通,支持弹性扩缩容。企业可按需选择管理节点设置在云上或云下。
3.HPC+AI 的高性能容器方案:适用于药物研发和业务流程复杂多样的生信业务,涉及应用版本众多、依赖环境复杂,不同的工作流可能基于不同的操作系统和编译器构建。阿里云E-HPC高性能容器应用eStack可让使用多种软件栈的生信应用运行在同一个平台,便捷管理,支持多种调度器和底层资源,兼容性非常高。
4.生信行业应用大内存解决方案:阿里云与合作伙伴 Memverge 联合推出,适用于需要进行海量数据分析的业务,如基因测序中每个细胞的表达量数据高达数十万条读取 (reads),这种海量级的数据分析需要大内存容量。使用部署 MemVerge Memory Machine 软件的 ECS i4p 实例作为计算节点,可满足业务对性能的极致要求,同时阿里云E-HPC可自动纳管所有节点。
5.生信行业应用高 IO 解决方案:基因组织学研究产生的数据增长快速且需永久保存,要求存储系统具有海量容量及高扩展性。另外,基因研究应用软件种类众多,部分计算任务对 IO 吞吐要求很高。对此,阿里云与合作伙伴联科集团联合推出生信行业应用高 IO 解决方案。
上述解决方案可以覆盖生命科学行业的绝大多数场景与需求,拥有覆盖全球的丰富算力,极致性能,弹性伸缩能力帮助客户降本提效,管控可视化帮助用户省心运维等优势。目前,阿里云高性能计算广泛应用于工业仿真(CAD/CAE)、芯片设计(EDA)、生物医药材料、能源勘探与公共服务等多个行业。
深势科技利用弹性供应的成本优化策略,结合抢占式实例的价格,以30%的成本完成海量资源的交付。同时云上弹性高性能计算E-HPC自动运维的特性,降低了深势科技的运维成本,提升了集群管理效率。
生命医学企业圣庭医疗通过上云优化了传统IDC集群的数据可靠性、运维成本及效率问题,基因比对与分析效率提升了70%。阿里云高性能计算团队还通过结合Slurm业务工作流dependency与自动伸缩的结合,减少了无效的计算资源浪费,有效降低了使用成本。
在本次峰会上,天池大赛-“创新大师杯冷冻电镜蛋白质结构建模大赛”颁奖典礼也同期举行,全球近2000名参赛者一同探索云计算与蛋白质研究的前沿课题,大赛全程从阿里云E-HPC平台、英特尔第三代至强可扩展处理器(Cooper Lake)、深度学习加速和增强型AVX-512指令集等软硬件结合的角度进行全程辅导和训练,推动全行业对人才培养的持续关注。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。