喜报|电信学院研究生发表高水平论文

作者: 时间:2026-06-18 点击数:

近日,我院刘薇老师科研团队在人工智能与计算机视觉领域权威期刊《Knowledge-Based Systems》(影响因子 IF=7.6)录用发表高水平学术论文,论文题为《Fine-grained visual classification network with background suppression and key feature enhancement》。2023 级电子信息专业硕士研究生李熙为论文第一作者,刘薇老师通讯作者。

第一作者李熙是 2023 级电子信息专业硕士研究生,主要研究方向为人工智能与模式识别。入学以来,他专注于计算机视觉、人工智能相关理论学习,主动参与各类科研项目,在理论学习与项目实操中持续积累,逐步夯实专业基础、积累工程实践经验,为本次论文研究工作提供了有力支撑。

该项成果充分体现我院在计算机视觉、细粒度图像识别等人工智能前沿领域的科研储备与创新能力,也印证了学院在培养兼具算法创新能力、工程实践素养的新工科研究生方面的良好成效。后续学院将持续完善科研平台建设,整合前沿学术与技术资源,助力更多学生在学术探索与工程实践中发挥所长、实现突破。

成果简介

该研究围绕细粒度图像分类任务展开,针对细粒度识别中目标判别区域占比小、复杂背景易造成识别干扰等现有技术难题,设计了融合背景抑制与关键特征增强模块的细粒度分类网络,较好改善了传统模型细微特征提取效果差、背景信息干扰识别精度等问题。

细粒度图像分类旨在区分同类物体的细微子类差异,是计算机视觉领域极具挑战性的研究方向。现有主流方法多基于卷积神经网络完成特征提取,并依靠最大池化、平均池化等一阶池化策略实现特征降维与分类推理。但单一统计特性的池化方式无法充分挖掘细粒度目标的微弱判别信息,难以实现精细化特征抽象;同时,图像中大量冗余背景信息会严重干扰模型对关键目标区域的聚焦能力,极大限制了细粒度分类模型的识别精度。

针对上述问题,文中创新性提出一种融合背景抑制与关键特征强化的细粒度视觉分类网络,从前端消除背景与中层特征优化两个维度完成网络结构创新。一方面,在网络前端设计背景激活抑制模块,通过特征激活图精准定位目标判别性核心区域,生成前景掩码并完成图像精炼裁剪,抑制复杂背景干扰。另一方面,设计改进型协方差池化模块,突破传统一阶池化的特征表达局限,精细化建模通道间关联特征,结合特征缩放分支完成关键特征增强,实现多层注意力特征的高效融合,显著强化模型对微小判别区域的特征感知能力。

研究团队在CUB-200-2011FGVC-AircraftStanford CarsFlowers 102四大主流细粒度公开数据集上开展大量对比实验,结果充分验证了该算法的有效性与通用性。所提网络可有效剥离复杂背景干扰、强化目标细微判别特征,显著提升细粒度图像分类的精度。

撰稿:行露    审核:张蕾