我院龚勋教授团队研究成果在国际人工智能顶会AAAI2023上作口头报告

来源:计算机与人工智能学院 发布日期: Sat Feb 18 00:00:00 CST 2023 浏览次数:2251

        2023年2月7-14日,国际人工智能顶级会议AAAI-2023在美国华盛顿召开,我院龚勋教授团队成果“Positional Label for Self-Supervised Vision Transformer”在本次会议上进行了口头报告。论文以西南交通大学为第一署名单位,2021级博士研究生章哲敏为第一作者,龚勋教授为通讯作者。

 

图1 报告封面

 

        AAAI会议(AAAI Conference on Artificial Intelligence)是由The Association for Advancement of Artificial Intelligence(国际人工智能协会)每年举办的学术会议,是人工智能领域公认的顶级学术会议,被中国计算机学会(CCF)列为A类国际会议。第37届AAAI会议共收到8777篇论文,录用论文1721篇,录用率约19.6%。
        近年,计算机与人工智能学院在计算机、人工智能领域国际会议的连续突破,反映出学院在“智能引领、交叉融合”的战略牵引下,在科研创新、扩大国际影响力、开拓国际视野等方面取得了重要进展。

 

论文标题:Positional Label for Self-Supervised Vision Transformer
论文简介:位置编码是视觉transformer (ViT) 获取输入图像空间结构的重要手段。在ViT中已经证明其有效性。在我们的工作中,我们提出训练ViT识别输入图像块的位置标签,这个看似简单的任务实际上产生了一个有意义的自我监督任务。基于之前关于ViT位置编码的工作,我们提出了两种专用于2D图像的位置标签:绝对位置和相对位置(如图2所示)。我们的位置标签可以很容易地插入到当前各种ViT变体中。它可以通过两种方式工作:(a) 作为传统ViT的辅助训练目标以获得更好的性能。(b) 结合完全自监督ViT,为语义特征学习提供更强大的自监督信号。本文提出的位置标签提高了ViT在识别任务上的性能。

 


图2 本文提出的相对位置标签