近日,第三十届国际计算机视觉与模式识别会议(30th IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2019)在美国加利福尼亚州长滩召开。本届会议共收到5160 篇提交论文,其中1294篇论文最终被收录,我校计算机学院媒体智能实验室俞俊教授团队的2篇论文被接收发表。
论文“Deep Modular Co-Attention Networks for Visual Question Answering”基于深度神经网络模型提出一种模块化协同注意力机制,有效解决视觉问答领域中的深度知识推理问题。该论文第一作者为计算机学院副教授余宙。
论文“On Exploring Indeterminate Relationships for Visual Relationship Detection”提出一种自动地关系生成模块,将人工标记的关系作为确定性关系,将人工未标记的关系作为非确定性关系。通过深度神经网络,在确定性关系的基础上,以非确定性关系作为补充,有效地提高了视觉关系检测的准确率。该论文第一作者为计算机学院副研究员詹忆冰。
此外,由余宙、俞俊教授共同指导,研究生崔宇豪、李敬为主力的算法团队还参加了CVPR2019举办的全球视觉问答竞赛VQA Challenge 2019,与国内外40多支参赛队伍同场竞技,最终战胜来自微软、Facebook、卡耐基梅隆大学等国际顶尖研究团队,获得比赛冠军,这也是截至目前国内研究团队在该项竞赛中获得过的最高荣誉。
CVPR 是计算机视觉及模式识别领域顶级国际学术会议,中国计算机学会(CCF)人工智能方向的A类会议。CVPR于1983年首次举行,涵盖计算机视觉、人工智能和机器学习等领域,在学术界和工业界都具有极为重大的影响力。