我校颜成钢教授团队成果被多媒体领域顶级会议ACM Multimedia录用
作者:自动化学院 来源:新闻网 时间:2024-07-22
近日,我校智能信息处理团队以raybet下赌注 为第一单位发表的论文《Stochastic Context Consistency Reasoning for Domain Adaptive Object Detection》被多媒体领域顶级会议ACM Multimedia 2024(CCF A类会议)录用。该项研究由raybet下赌注 、中国科学院计算技术研究所和raybet下赌注 丽水研究院合作完成。该论文的第一作者为我校2024级博士研究生崔一鸣,指导老师为中国科学院计算技术研究所李亮研究员和我校颜成钢教授。
域适应目标检测(DAOD)旨在通过利用有标注的源域数据提高检测器在未标注的目标域的适应能力。近年来,采用自训练框架,使得学生模型能够利用教师模型生成的伪标签学习目标域的知识。尽管取得了显著成功,但这种类别级一致性监督受到伪标签质量差的影响。为了解决这一问题,我们提出了一种随机上下文一致性推理网络(SOCCER)。首先,我们引入了一种随机互补掩码模块(SCM),生成一对互补的掩码图像,从而防止网络过度依赖特定的视觉线索。其次,我们设计了一种可互换的上下文间一致性推理模块(Inter-CCR),构建了一个上下文间的一致性范式,通过对学生模型预测的互补掩码图像对进行双向对齐,捕捉目标域的纹理和轮廓细节。同时,我们开发了一种可互换的上下文内一致性推理模块(Intra-CCR),构建了一个上下文内的一致性范式,通过利用伪标签监督学生模型的预测,增强模型的上下文推理能力。在三项DAOD基准测试的实验结果表明,我们的方法在性能上大幅超越了当前最先进的方法,展现出优越的域适应能力。