近日,阿里云携手英特尔(中国)主办的“英特尔创新大师杯”冷冻电镜蛋白质结构建模大赛宣布开放报名。据介绍,该赛事旨在探索人工智能在获取蛋白质结构原子模型方面的潜力。
准确的蛋白质结构原子模型不仅能够帮助研究者理解生命活动的内在原理,还能为药物研发提供指导。蛋白质结构预测主要在已知蛋白质序列中寻找相似序列,根据序列的相似性来判断使用哪些已知结构来构建未知结构,同时考虑其他可能改变蛋白质结构的因素。总结下来就是找相同序列,使用已知结构推测未知结构。
AlphaFold2利用AI技术建立蛋白质序列和蛋白质结构的关系,不断学习已知序列和结构进而进行蛋白质结构预测。在强大的算法与算力的支持下,DeepMind将运算时间从数月缩短至了数小时,这对于人类攻克疑难杂症有着划时代的意义。
据了解,目前解析蛋白质结构的主流方法有x射线晶体学(x-ray crystallography)、核磁共振波谱法(nuclear magnetic resonance spectroscopy)和冷冻电镜方法(cryo-electron microscopy),其中前两者需具有长时间的实践积累、成熟的工作流程及较为严苛的使用条件。随着软硬件方面的突破,冷冻电镜方法,尤其是冷冻电镜单颗粒分析(single-particle cryo-EM)逐渐成为首选方案。但是出于准确度要求,此项工作仍旧繁琐。
为了满足医学科研等领域的海量算力需求,阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)基于第三代英特尔®至强®可扩展处理器(Cooper Lake)打造算力平台。依托阿里云基础设施,该平台可面向教育科研、企事业单位和个人,提供快捷、弹性、安全的一站式公共云HPC服务。
据悉,本次大赛基于阿里云E-HPC平台和第七代服务器ECS高主频实例进行,以冷冻电镜三维结构解析的实际应用场景为基础,提供生物大分子的氨基酸序列以及在冷冻电镜下取得的电势能分布,要求参赛选手结合从数据库中选取的训练数据集,利用深度学习方法搭配云端算力支持,探索从实验数据到高精度蛋白质原子结构的智能化解决方案。以期达到改善目前蛋白质结构搭建工作的整体效率和准确率、减轻科研工作者负担。
据介绍,本次大赛赛题由达摩院建议发起,阿里云天池平台承办,联合了国家蛋白质科学中心等权威团队。后续,达摩院药学AI组还将追踪和优化相关技术对行业的提升效果。
即日起到9月28日,个人、高等院校、科研单位、企业、创客团队等人员均可报名,参赛人员在成功完成同期的初赛环节后,经过复赛、决赛,将有机会角逐28万元人民币的奖金池。
报名链接:
https://tianchi.aliyun.com/specials/promotion/intelinnovativemasterhighperformancecomputingcontest--predictproteinstructurewithcyro-em?spm=5176.14154004.J_1916026360.3.31fe5699qWz5kl
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。