吴晓教授团队4篇论文被国际顶级会议ACM Multimedia 2022录用

来源:计算机与人工智能学院 发布日期: Thu Jul 28 00:00:00 CST 2022 浏览次数:2136


       计算机与人工智能学院吴晓教授团队4篇论文被国际顶级会议——第30届国际多媒体学术会议(ACM International Conference on Multimedia,简称ACM MM)录用。这四篇论文均是以西南交通大学为第一署名单位。在全球2473篇有效投稿中,690篇论文被录用,接收率为27.9%。国际多媒体学术会议(ACM MM)是计算机学科公认的多媒体领域和计算机视觉领域的国际顶级会议,被中国计算机学会(CCF)列为A类会议。在教育部第四轮学科评估中,CCF A类会议论文被列为重要的论文发表指标项。这是团队连续七年在CCF A类国际一流会议发表高水平论文,标志着我院在人工智能和计算机视觉领域的研究成果得到了国际同行的认可。
       论文《CrossNet: Boosting Crowd Counting with Localization》(作者:Ji Zhang, Zhi-Qi Cheng, Xiao Wu, Wei Li, Jian-Jun Qiao)提出了一种新型位置引导框架CrossNet用于人群计数。生成高质量的密度图是人群计数的关键步骤,利用人的头部位置可以自然地突出拥挤区域,消除背景噪声的干扰。然而,现有的人群计数方法仍然难以在密度谱生成中合理使用位置信息。论文所提出的框架通过双分支联合训练将位置监督集成到人群密度图。通过一种新的分支网络用于定位行人的潜在位置,采用自适应密度注意力模块进一步提高定位精度,利用密度感知定位损失将注意力分配到不同的人群密度等级,从而关注高密度区域的同时较少关注低密度区域。所提出的方法在四个基准数据集上进行了验证,方法在人群计数和人群定位方面都优于现有前沿方法。

 

图1 CrossNet总体框架图

 

       论文《Domain-Specific Conditional Jigsaw Adaptation Network for Enhancing Transferability and Discriminability》(作者:Qi He, Zhaoquan Yuan, Xiao Wu, Jun-Yan He)提出了一种基于解决拼图问题的域适应方法(DCJAN),缓解了传统域适应方法中可迁移性与可判别性难以共存的问题。图像跨域适应性问题是当前迁移学习领域的研究热点,DCJAN设计保持类别一致性的条件拼图以提升特征的可判别性。同时,提出了基于条件拼图的特征自适应方法,在拼图知识的引导下进行跨域特征对齐,提升特征的可迁移性。该方法在四个公开数据集上验证其有效性。

 

图2 DCJAN总体框架图

 

       论文《Real-time Semantic Segmentation with Parallel Multiple Views Feature Augmentation》(作者:Jian-Jun Qiao, Zhi-Qi Cheng, Xiao Wu, Wei Li, Ji Zhang)提出了一种平行多视特征增强方法(MvFSeg)用于实时语义分割。实时语义分割是自动驾驶领域的前沿研究之一,而实际场景中的目标尺度不一致、外观多样、背景复杂等因素给实时语义分割带来了巨大的挑战,MvFSeg采用轻量级主干网络来实现模型的高效推理,设计了平行多深度卷积来捕获具有多尺度感受域的高级语义特征。针对轻量级主干网络特征表达能力弱的问题,构建了高效渐进式密集特征聚合结构来有效聚合多视特征。该方法在两个公开自动驾驶数据集上取得了当前最优性能。同时,该方法是一个通用的实时语义分割框架,适用于不同的轻量级主干网络。

 

图3 MvFSeg总体框架图

 

       论文《Learning Action-guided Spatio-temporal Transformer for Group Activity Recognition》(作者:Wei Li, Tianzhao Yang, Xiao Wu, Xian-Jun Du, Jian-Jun Qiao)提出了一种基于动作引导的时空Transformer方法(ASTFormer)用于群体活动识别。群体动作识别在视频监控、社会行为理解等领域具有重要应用。ASTFormer通过学习以动作为中心的聚合特征和建模时空动作关联性来捕获群体活动识别的交互特征,解决了群体活动中不均衡时空动作关系建模问题。在全局动作信息的监督下,活动参与者被分配到潜在动作,建立以动作为中心的聚合特征,双支路Transformer用于精细化帧间和帧内的动作特征,通过构建的语义动作图对动态的动作交互进行建模。所提方法在两个公开的数据集上战胜了现有方法。

 

图4  ASTFormer总体框架图

 

       计算机与人工智能学院在计算机领域国际会议的连续突破,反映出学院在“智能引领、交叉融合”的战略牵引下,在计算机视觉、智能交通等方面取得了重要进展。