李天瑞教授团队博士后两篇论文在人工智能顶级期刊IEEE TPAMI发表

来源:计算机与人工智能学院 发布日期: Wed Apr 01 00:00:00 CST 2026 浏览次数:229

        近日,李天瑞教授团队博士后2篇论文被国际顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)录用。TPAMI是人工智能、机器学习与模式识别领域公认最具影响力的国际顶级期刊,同时也是中国计算机学会(CCF)和中国人工智能学会(CAAI)推荐的A类期刊,近五年平均影响因子为20.4。该期刊以极为严苛的同行评审和录用标准著称,最终录用率通常不足10%。此次团队两篇论文同时被录用,标志着团队在相关领域的研究水平获得国际同行的高度认可。
        论文《Variational Bayesian Personalized Ranking》第一作者为刘斌博士后(合作导师:李天瑞教授)。成对学习是信息检索、排序优化以及基于 RLHF(基于人类反馈的强化学习)基础范式。针对现有成对学习在监督稀疏、标签噪声、数据偏差场景下泛化性不足的问题,该研究引入离散隐变量对样本标签的不确定性进行显式建模,将成对学习重构为基于证据下界优化的变分推断框架,提出一种理论可解释、计算高效、可控性强的成对学习损失函数。该损失函数采用变分推断与变分学习两阶段优化策略,通过推导闭式变分后验,使偏差调控与噪声抑制过程具备清晰的可解释性;同时借助后验压缩技术,将计算复杂度降至与标准成对损失相当的线性阶,并利用 Jensen 间隙上界严格保证近似误差可控。此外,论文还提供了严格的泛化保证,揭示了先验分布误设带来的机会成本。在信息检索与推荐系统等典型场景的实验充分验证了其性能提升以及去偏、去噪的有效性。

 

图 1  基于证据下界优化的变分推断框架示意图

论文地址:https://ieeexplore.ieee.org/abstract/document/11429075

 

        论文《Harnessing Meta-Learning for Controllable Full-Frame Video Stabilization》第一作者为Muhammad Kashif Ali博士后(合作导师:李天瑞教授)。视频稳定是计算机视觉领域的一项基础性任务,旨在消除手持拍摄中的抖动,提升视觉体验及下游任务性能。现有全帧像素级合成方法虽能生成完整画幅的稳定视频,却因运动模式与视觉内容的多样性而难以实现鲁棒泛化,且缺乏可控性。论文针对该任务中的自适应难题,提出了一种基于元学习的快速测试自适应框架,通过元训练使模型仅利用输入视频即可快速调整参数,在单次自适应迭代中即获得显著性能提升;进一步设计了急动定位模块与空间感知采样策略,聚焦于高抖动区域进行高效自适应,以最小计算开销实现最大稳定增益。实验结果表明,该框架在NUS、BiT、DOFVS等多个真实世界数据集上均达到最先进性能,并验证了其在跟踪、目标检测等下游任务及现代视频理解系统中的适用性,为全帧视频稳定提供了兼具可控性与高效性的新范式。

 

图 2  基于元学习的快速测试自适应框架示意图

论文地址:https://ieeexplore.ieee.org/document/11458882


        李天瑞教授团队始终注重对青年学者的悉心指导与倾力帮助,营造开放进取的学术氛围。此次两位博士后的研究成果相继被人工智能领域顶级期刊TPAMI录用,是团队在人工智能基础理论与应用研究方面取得的重要进展,也是高层次人才培养与高水平研究融合发展的新突破。