学院最新研究成果被人工智能顶级会议NeurIPS 2025接收

来源:计算机与人工智能学院 发布日期: Thu Oct 23 00:00:00 CST 2025 浏览次数:131

        近日,学院4篇论文被人工智能顶级会议——第39届神经信息处理系统大会(NeurIPS 2025)录用。大会将于2025年12月在美国圣地亚哥和墨西哥举行。NeurIPS 是机器学习与计算神经科学领域的国际顶级学术会议,被中国计算机学会(CCF)推荐为A类国际学术会议,长期位居全球人工智能与机器学习领域国际学术会议影响力前列。
        论文《Efficiently Maintaining the Multilingual Capacity of MCLIP in Downstream Cross-Modal Retrieval Tasks》(作者:Fengmao Lv, Jitong Lei, Guosheng Lin, Desheng Zheng, Jianyang Zhang, Tianrui Li)第一作者为吕凤毛副教授,西南交通大学为第一署名单位。该研究揭示了多语言CLIP模型(MCLIP)由于语言间差异问题,在下游任务中通过单一源语言微调时会导致模型的多语言能力下降。平行语料学习方法可以解决上述问题,然而会存在大量的计算消耗。论文通过系统性研究发现词元相似性是影响跨语言迁移能力的关键因素。论文提出了两种创新策略:1) TaPCL (Transferability-aware Parallel Corpora Learning)通过动态优化训练过程,优先对词元重叠度低的目标语言进行语料采样,减少冗余计算;2) CiPCL (Critical-information Parallel Corpora Learning)通过在源语料中添加多语言关键术语来丰富语料,实现有针对性的知识迁移,无需依赖大量平行数据。通过平衡采样权重与注入领域关键信息,显著降低了计算成本并减轻了对平行语料库的过度依赖。综合实验表明,所提出的方法在显著提升训练效率的同时,也保证了下游任务的性能。

 

图1  多语言模型的下游任务训练图

 

        论文《VA-GS: Enhancing the Geometric Representation of Gaussian Splatting via View Alignment》(作者:Qing Li,Huifang Feng,Xun Gong,Yu-Shen Liu)第一作者为李庆特聘副研究员,西南交通大学为第一署名单位。论文提出了一种新的方法VA-GS (View-Aligned Gaussian Splatting),旨在提升3D Gaussian Splatting的几何表示能力,从而改善表面重建与新视角合成效果。现有3DGS方法虽能实现高质量实时渲染,但在表面精确性和多视图一致性方面表现不佳。论文通过引入边缘感知的图像线索增强边界描绘,结合可见性感知的光度对齐以减少遮挡歧义,并利用法向约束优化高斯空间分布,提升了几何一致性。此外,还利用深度特征嵌入提高在不同光照和视角下的鲁棒性。实验结果表明,该方法在标准数据集上均实现了优于现有方法的性能,在表面重建与新视角合成方面均达到了前沿水平。

 

图2  存在光照阴影条件下的表面重建结果图

 

        论文《Gate to the Vessel: Residual Experts Restore What SAM Overlooks区》(作者:Weili Jiang,Jinrong Lv,Xun Gong,Chubin Ou)第一作者为蒋卫丽助理教授,西南交通大学为第一署名单位。基础分割模型如Segment Anything (SAM)在自然图像中表现出强大的泛化能力,但在医学影像中却常出现局部失效,尤其是对于形态复杂、边界模糊的血管等精细结构。为了解决这一问题,论文提出了一种基于结构感知稀疏专家框架(Structure-aware Sparse Expert Framework)的FineSAM++模型,用于对SAM的输出进行智能细化。该方法引入了基于置信度的软路由模块(Soft Routing Module),能够动态识别结构不确定的区域,并仅在这些区域内激活轻量级残差专家(Residual Expert),对结构性残差误差进行建模与修正,从而实现高效的精修而非重训。大量实验验证了所提的方法在三种不同模态的2D血管数据集上达到了当前最先进的性能。

 

图3   结构感知的稀疏专家框架图

 

        论文《Pragmatic Heterogeneous Collaborative Perception via Generative》(作者:Junfei Zhou,Penglin Dai, Quanmin Wei, Bingyi Liu, Xiao Wu, Jianping Wang)第一作者为硕士生周骏飞,通讯作者为戴朋林副教授,西南交通大学为第一署名单位。论文提出了生成式通信机制GenComm,并将其作为V2X系统的传输方案。具体而言,发送端通过定制的可变形信息提取器提取特征中的关键空间信息,接收端则利用条件扩散模型,以发送端的空间信息为引导,生成包含发送端空间信息与自身语义空间一致的中间特征,随后将这些生成的空间特征用于融合。所提方法具有以下优点:1)非侵入性,不破坏已有模型,2)通信高效,仅传输关键空间信息,3)高扩展性,以非常小的计算量和参数量可以兼容不断加入的新合作者。实验表明,GenComm在三个公开数据集,OPV2V、DAIR-V2X以及V2X-Real上展现出优异性能,验证了生成式通信机制的有效性。

 

图4 GenComm模型框架图