我院龚勋教授团队研究成果在国际人工智能顶会AAAI2023上作口头报告
2023年2月7-14日,国际人工智能顶级会议AAAI-2023在美国华盛顿召开,我院龚勋教授团队成果“Positional Label for Self-Supervised Vision Transformer”在本次会议上进行了口头报告。论文以西南交通大学为第一署名单位,2021级博士研究生章哲敏为第一作者,龚勋教授为通讯作者。

图1 报告封面
AAAI会议(AAAI Conference on Artificial Intelligence)是由The Association for Advancement of Artificial Intelligence(国际人工智能协会)每年举办的学术会议,是人工智能领域公认的顶级学术会议,被中国计算机学会(CCF)列为A类国际会议。第37届AAAI会议共收到8777篇论文,录用论文1721篇,录用率约19.6%。
近年,计算机与人工智能学院在计算机、人工智能领域国际会议的连续突破,反映出学院在“智能引领、交叉融合”的战略牵引下,在科研创新、扩大国际影响力、开拓国际视野等方面取得了重要进展。
论文标题:Positional Label for Self-Supervised Vision Transformer
论文简介:位置编码是视觉transformer (ViT) 获取输入图像空间结构的重要手段。在ViT中已经证明其有效性。在我们的工作中,我们提出训练ViT识别输入图像块的位置标签,这个看似简单的任务实际上产生了一个有意义的自我监督任务。基于之前关于ViT位置编码的工作,我们提出了两种专用于2D图像的位置标签:绝对位置和相对位置(如图2所示)。我们的位置标签可以很容易地插入到当前各种ViT变体中。它可以通过两种方式工作:(a) 作为传统ViT的辅助训练目标以获得更好的性能。(b) 结合完全自监督ViT,为语义特征学习提供更强大的自监督信号。本文提出的位置标签提高了ViT在识别任务上的性能。
图2 本文提出的相对位置标签
相关文章
学院研究成果被多媒体顶级会议ACM MM 2025录用
学院4篇论文被国际顶级会议——第33届国际多媒体学术会议(ACM International Conference on Multimedia,简称ACM MM)录用,会议将于2025年10月27日至31日在爱尔兰都柏林举行……
计算机学院成功举办“党建引领聚合力、校企同心育英才”青年教师企业面对面系列活动
为深入推进教育、科技、人才“三位一体”融合发展,助力学院青年教师迅速成长,全面提升学院整体科研实力,7月8日下午,学院副院长滕飞带领学院青年教师,前往华为技术有限公司成都研究所黄大年茶思屋,共同举办“党建引领聚合力、校企同心……
学院最新研究成果被计算机视觉顶级会议ICCV2025接收
近日,学院3篇论文被计算机视觉顶级会议ICCV2025(ICCV 2025, International Conference on Computer Vision)接收。会议将于2025年10月19日至25日在美国夏威夷举……