6月9日,生物物理团队刘士勇课题组受邀在《Current Opinion in Structural Biology》撰写题为“Challenges in structural modeling of RNA-protein interactions”的综述论文,系统地总结了蛋白质-RNA复合物结构建模方法,并展望了人工智能技术在计算预测蛋白质-RNA相互作用方面的应用潜力。物理学院硕士研究生刘旭东为该论文第一作者,硕士生段颖添、洪旭博士、谢娟博士为共同作者,刘士勇副教授为通讯作者。
图1:蛋白质-RNA复合物结构建模算法示意图
RNA结合蛋白(RBP)在细胞中特异性地结合RNA,其复合物在转录后基因调控中发挥重要作用。实验解析的RBP-RNA复合物结构的数量远远小于已知的RBP-RNA相互作用对的数量。因此,通过计算方法建模RBP-RNA复合物的三维结构显得非常必要。最近的人工智能技术在蛋白质结构领域取得了重大突破性进展,DeepMind团队在AlphaGo的基础上开发了从序列预测蛋白质3D结构的方法AlphaFold(Nature,2020)与AlphaFold2(Nature,2021),取得了和实验差不多的精度,而且发现该模型也能较高精度地预测蛋白质-蛋白质复合物结构(AlphaFold-Multimer, bioRxiv 2022),但不能预测蛋白质-RNA复合物结构。因此,如何利用人工智能技术预测蛋白质-RNA复合物结构成为下一个急需解决的前沿热点问题。基于此,该论文总结了最近10多年蛋白质-RNA复合物结构预测领域的进展,并提出了未来可能突破的方向。未来的工作包括探索RNA修饰和共进化信号,利用人工智能技术开发新的蛋白质-RNA结构建模方法存在较大的可行性。
该研究工作得到了国家自然科学基金委面上项目的资助。
刘士勇副教授课题组长期致力于于蛋白质-RNA相互作用、RNA编码潜能等问题研究,在RNA编码潜能评估算法CPPred(Nucleic Acids Research, 2019);RNA结构比对算法RMalign(BMC Genomics, 2019)以及发现了780个RNA折叠类型(RNA Biology, 2021);蛋白质-RNA复合物结构预测方法(自由对接3DRPC(Scientific reports, 2013);基于模板的PRIME(PLOS Computational Biology,2016);联合自由对接与基于模板的服务器P3Dock(Bioinformatics, 2019));RNA结合蛋白质预测方法RBPPred (Bioinformatics, 2016)与实验验证(Genomics, 2021);基因组尺度蛋白质-RNA相互作用位点预测(Communications Biology, 2020);蛋白质-RNA相互作用强度数据集与理论预测模型(Protein Science, 2013;Proteins: Structure, Function, and Bioinformatics,2023)等领域取得一系列原创研究成果。这些工作受到国内外同行关注,被引用超1200次(H-index=20)。
论文链接:https://www.sciencedirect.com/science/article/pii/S0959440X23000970