计算机科学与技术学院2021级电子信息专业研究生杨云飞以第一作者在SCI四区期刊Journal of Electronic Imaging (影响因子:0.829)发表研究论文,论文题目为《EPformer: An Efficient Transformer-based Approach for Retail Product Detection in Fisheye Images》。
该论文是在我校邓红卫教授的指导下完成,衡阳师范学院计算机科学与技术学院、智能信息处理与应用湖南省重点实验室为署名单位。论文核心理论是:在鱼眼相机拍摄的场景中,零售商品的检测经常受到过度的物体遮挡和形变的影响,以及难以区分具有细微差别的商品,因此在这种图像中准确地对商品进行分类和定位是计算机视觉的一项新挑战。这项工作通过融合Visual Transformer和CNN,提出了一个名为EPformer的高效商品检测网络,以可靠地检测鱼眼图像中的零售商品。针对商品对象的密集遮挡问题,论文采用移位窗口策略进行跨窗口的特征信息交互,以更准确地检测商品对象。为了解决鱼眼相机带来的过度物体变形问题,论文提出了一个无需显式校正的鱼眼图像处理模块(DIP),并将其嵌入PANet结构中。这使得该模型能够更好地捕捉商品物体的几何变化并进行特征融合。为了更好地区分细粒度商品对象,论文设计了一个高效的注意力模块(ECSE),它可以从空间和通道关系上捕捉个体间纹理和边界信息的细粒度差异。将ECSE模块与解耦头联合训练,可以解决无法区分细粒度商品物体的问题。实验结果表明,EPformer是一个高效的商品检测模型,在鱼眼商品图像数据集上的平均精度mAP优于其它方法。