8月15日,我院生物物理团队黄胜友教授课题组在跨膜蛋白相互作用预测领域取得重要进展,相关成果发表于《自然·通讯》(Nature Communications, 2023,14: 4935),题目为《基于深度迁移学习的跨膜蛋白复合物链间接触预测》(Deep transfer learning for inter-chain contact predictions of transmembrane protein complexes)。华中科技大学为唯一通讯单位,我院博士生林培聪为论文第一作者,毕业博士生严雨蒙和博士生陶环宇为共同作者,黄胜友教授为通讯作者。值得注意的是,严雨蒙博士为我院2012级物理学实验班本科生,林培聪博士和陶环宇博士为我院2015级严济慈英才班本科生。
膜蛋白在生命细胞中扮演着许多不同且重要的功能,人类基因中大约有四分之一参与编码膜蛋白。膜蛋白链间的残基接触信息对于预测膜蛋白复合物结构有着至关重要的作用,并且对理解膜蛋白的相互作用分子机制有着重要价值。目前,大部分的方法致力于研究可溶单体和复合物蛋白的相互作用残基接触预测。由于膜蛋白其复杂的周边环境与可溶蛋白质存在较大的不同,现有的方法在膜蛋白复合物的链间接触预测上的准确率还有待提升。另外,由于实验测定跨膜蛋白复合物的困难,现有数据库中实验解析出的非冗余跨膜蛋白复合物数量仍然稀缺。因此,迫切需要提出新的方法来预测跨膜蛋白的链间相互作用,进而确定其复合物结构和理解其生物学功能。
为了解决这一问题,黄胜友教授课题组提出了一种基于深度迁移学习的跨膜蛋白复合物链间接触预测方法-DeepTMP。DeepTMP主要从网络架构和膜蛋白数据迁移学习两个方面来有效提升模型在膜蛋白复合物链间接触预测的准确性和鲁棒性。首先,DeepTMP主要利用蛋白质语言模型(ESM-MSA-1b)提取蛋白质序列的表征以及隐含共进化信息的注意力矩阵。其次,DeepTMP结合了ResNet-Inception和Triangle-aware两个模块来有效地预测跨膜蛋白链间接触。其中,ResNet-Inception模块增加了卷积网络的感受野来有效地捕捉长程相互作用,而Triangle-aware模块通过利用主流的注意力机制作用于三个氨基酸中的成对表征来驱使网络预测的接触尽可能的满足几何约束。最后,基于跨膜蛋白复合物和可溶蛋白复合物的相互作用界面存在相似的物理相互作用这一特性,DeepTMP先在数据充足的可溶蛋白复合物中进行预先训练来学习通用特性,并在有限数量的跨膜蛋白质复合物中进行深度迁移学习来识别膜蛋白中的独有特征。通过在不同测试集上对DeepTMP进行详细的评估,并与其他的先进的预测算法进行比较。结果表明,DeepTMP的准确率和鲁棒性都优于其它算法,不仅能够显著提高跨膜蛋白复合物中链间的接触预测准确率,同时在可溶蛋白复合物预测中拥有较高的准确率。此外,通过在拓扑结构和低聚物状态的进一步分析,DeepTMP在不同拓扑结构中展现较好的准确性和鲁棒性,以及具有能够区分膜蛋白单体和复合物的能力。最后,DeepTMP预测的链间残基接触可结合我们的HSYMDOCK分子对接算法以及ITScorePP能量函数来预测跨膜蛋白的复合物结构,该策略能够显著地提升预测的精度。
黄胜友教授课题组多年来一直致力于生物大分子的结构及其相互作用计算与预测研究,在蛋白质-蛋白质、蛋白质-多肽、蛋白质-小分子和蛋白质-核酸相互作用及复合物结构预测方面做了许多重要的工作,开发了一系列算法、软件和计算平台,并在Nature Protocols、Nature Communications、Journal of the American Chemical Society、Proceedings of National Academy of Sciences、Nucleic Acids Research、Bioinformatics、Drug Discovery Today等国际著名期刊发表多篇论文。
该项研究工作得到了国家自然科学基金(62072199,32161133002)和学校人才引进基金的资助。
论文链接:https://doi.org/10.1038/s41467-023-40426-3