喜报!学院杨燕教授团队最新研究成果在深度学习顶级会议ICLR2024发表

来源:计算机与人工智能学院 发布日期: 2024-05-31 浏览次数:671

 

 

      

         据悉,于2024年5月7日至11日在奥地利维也纳举行的第十二届国际学习表征会议(ICLR 2024, The Twelfth International Conference on Learning Representations)圆满结束。该会议发表了学院杨燕教授团队的最新研究成果《GTMGC: Using Graph Transformer to Predict Molecule’s Ground-State Conformation》,并将其评为Spotlight Presentation(录用率仅为5%)。该论文以西南交通大学为第一署名单位,2022级硕士研究生徐桂昆为第一作者(导师杨燕、江永全),通讯作者为江永全老师。
        ICLR会议,自2013年首次举办以来,迅速成为深度学习领域的顶尖学术盛会。由深度学习领域的权威人物,图灵奖得主Yoshua Bengio和Yann LeCun牵头创立,ICLR以其开放的评审机制和高质量的论文而闻名。该会议虽暂未被中国计算机学会CCF列入评级,但其属于中国人工智能学会CAAI推荐的A类会议。此外,ICLR与NeurIPS (Annual Conference on Neural Information Processing Systems) 和ICML (International Conference on Machine Learning) 并称为深度学习领域的三大顶会,受到业界的广泛认可。此项研究获得国家自然基金和中央高校基金等多个项目的资助。

 

 

        分子的基态构象通常对其性质起着决定性的作用。然而,通过物理实验测定或计算化学方法,如密度泛函理论(DFT),获取这种构象既耗时又费力。通过分子力学的方法,建立一些经验函数(又称为分子力场),可以粗略计算出分子中原子之间的键的长度、角度和二面角等,典型的计算软件有RDKit、Open Babel等,计算速度快但是精度较低,而且在计算环形分子时可能出现失败。基于深度学习的分子构象预测,具有计算速度快、精度有望接近DFT或实验测定等优点,适用于大规模的分子筛选,例如新药研发中的高通量虚拟筛选等,因此具有重大的科学意义和应用价值。

 

 

        本文提出了GTMGC,一种基于Graph Transformer (GT)架构的神经网络,实现了从分子的二维拓扑图结构到其三维基态构象的端到端预测。此外,本文提出了一种名为分子结构残差自注意力(Molecule Structural Residual Self Attention, MSRSA)的新型的用于分子结构建模的自注意力机制。该机制极大程度地保留了原始自注意力机制的易用性和优雅性,使其可以被快速而轻易地应用到其他的分子建模任务中,并取得可观的性能。本文的方法已在Molecule3D基准数据集和QM9数据集上进行了充分的评估。实验结果表明,本文的方法取得了显著的性能,并超越了当前最先进的方法以及被广泛使用的开源软件RDKit。

 

 

        团队介绍
        杨燕、江永全团队多年来一直从事人工智能与数据挖掘方面的研究,近年来转向AI for Science方向,重点是人工辅助新药物发现、新材料发现。先后主持/主研科研项目10余项,其中国家自然科学基金项目9项、国家科技支撑计划项目2项和省部科研项目4项。近5年来在《IEEE Transactions on Knowledge and Data Engineering》、《Information Fusion》、《Information Science》、《Knowledge-Based Systems》、《IEEE Transactions on Audio, Speech and Language Processing》、《Briefings in Bioinformatics》、《IEEE-ACM Transactions on Computational Biology and Bioinformatics》、《软件学报》等国际顶级期刊及ICLR、IJCAI、CIKM、IJCNN、IEEE BIBM等国际一流会议上发表关于人工智能与深度学习的研究成果20余篇。