您好,欢迎访问开云网站!
您好,欢迎访问开云网站!
集团动态
联系开云
发布日期:2024-11-26 作者:开云
近日,中国科学手艺年夜学认知智能全国重点尝试室刘淇传授指点博士生张载熙和哈佛年夜学医学院Marinka Zitnik传授课题组合作,设计了一种基在图暗示进修和卵白质说话模子的深度生成算法PocketGen,生成与小份子连系的卵白质口袋序列和空间布局。尝试验证注解,PocketGen在生成成功率和效力方面均跨越了传统方式。相干功效以“Efficient Generation of Protein Pockets with PocketGen”为题在北京时候11月15日颁发在《天然 机械智能》(Nature Machine Intelligence)期刊。
研发合用在科学发现使命的人工智能算法,例如功能卵白质设计,是认知智能全国重点尝试室的一个主要研究标的目的。在药物发现和生物医疗范畴,设计与小份子连系的功能卵白质(例如酶和生物传感器)具有主要意义。但是,基在能量优化和模板匹配的传统方式计较速度慢、成功率低。基在深度进修的模子又存在份子-卵白质复杂彼此感化建模难,序列-布局依靠关系进修难等问题。是以,成长高效、高成功率且正确反应物理化学纪律的卵白质口袋生成算法是该范畴的孔殷需求。
研究团队在前期卵白质口袋生成工作FAIR(NeurIPS 23 Spotlight)和PocketFlow(NeurIPS 24 Spotlight)的根本上,研发了PocketGen(图1)。PocketGen可以基在卵白质框架和连系小份子生成卵白质口袋序列和布局(图1a)。PocketGen首要由两部门构成。第一部门为双层图Transformer编码器(图1b):该模子受卵白质固有的层级布局开导,包罗氨基酸层级编码器和原子层级编码器,进修分歧细粒度的彼此感化信息,并更新氨基酸/原子暗示和坐标。第二部门为卵白质预练习说话模子(图1c):PocketGen高效微调了ESM2模子,辅助氨基酸序列猜测。具体方式为:PocketGen固定年夜部门模子层不变,仅微调部门顺应层参数,进行序列-布局信息交叉留意力计较,加强序列-布局一致性。在尝试中,PocketGen模子不但在亲和力和布局公道性等指标上跨越传统方式,在计较效力方面也有年夜幅提高(比拟传统方式晋升跨越10倍)。
图1. (a) 用PocketGen进行卵白质序列-布局配合设计。(b) 双层图Transformer编码器;(c) 卵白质预练习说话模子用在序列猜测和高效微调手艺。
进一步地,团队在芬太尼和艾必克等小份子连系卵白质口袋设计使命中进行了验证,并与新晋诺贝尔奖得主David Baker传授尝试室的生成模子RFDiffusion、RFDiffusionAA等进行比力,验证了PocketGen的有用性。别的,还将PocketGen发生的留意力矩阵与基在第一性道理和力场摹拟阐发软件获得的成果进行对照展现,注解基在深度进修的PocketGen具有较好可注释性(图2)。
图2. 左边图为薛定谔软件阐发的卵白质-小份子彼此感化关系图。在右边展现的是PocketGen两个留意力矩阵头的热图,与左边彼此关系成功对应上。
该工作推动了深度生成模子用在功能卵白质设计,为进一步理解卵白质设计纪律并展开生物尝试验证奠基了根本,也揭示了人工智能方式在解决药物研发和生物工程范畴主要科学问题上的优势。
中国科学手艺年夜学为本文第一单元,计较机科学与手艺学院博士生张载熙为本文第一作者,刘淇、Marinka Zitnik为本文配合通信作者。本研究获得了中国科年夜陈恩红传授、刘海燕传授等的贵重建议,和首届国度天然科学基金青年学生根本研究项目(博士生)、中国科学手艺年夜学优异博士生出邦交流撑持打算和中心高校科研启动经费等帮助。
论文链接:https://www.nature.com/articles/s42256-024-00920-9
(认知智能全国重点尝试室、计较机科学与手艺学院、人工智能与数据科学学院)
特殊声明:本文转载仅仅是出在传布信息的需要,其实不意味着代表本网站不雅点或证实其内容的真实性;如其他媒体、网站或小我从本网站转载利用,须保存本网站注明的“来历”,并自大版权等法令责任;作者假如不但愿被转载或联系转载稿费等事宜,请与我们联系。