计算机科学与技术学院2020级电子信息专业研究生张攀以第一作者在SCI三区期刊CMC-Computers Materials & Continua (影响因子:3.734)发表研究论文,论文题目为《RT-YOLO: A Residual Feature Fusion Triple Attention Network for Aerial Image Target Detection》。
该论文是在我校邓红卫教授的指导下完成,衡阳师范学院计算机科学与技术学院、智能信息处理与应用湖南省重点实验室为署名单位。论文核心理论是:近年来,无人机(UAV)空中图像的目标检测已成为最热门的话题之一。然而,无人机航拍图像中的目标检测往往存在误检测和漏检。我们提出了RT_YOLO算法,以改善无人机空中图像中目标检测中出现的问题:(1)设计了一种新的残差结构CSP_RT,通过增强单层内部特征的融合来提高提取特征的能力。同时,增加了三重注意模块Triplet Attention,以加强空间和渠道之间的联系,更好地保留重要的特征信息。(2)通过改进多尺度特征金字塔结构SPP1和SPP2,加强不同尺度的特征融合,丰富了特征信息。(3)设计了一个新的损失函数,引入锚框的对角惩罚项,以提高训练速度和推理精度。实验表明,在航空图像(VEDAI)数据集上,RT-YOLO的平均精度(mAP)从57.2%提高到60.8%,在遥感物体检测(RSOD)数据集的平均精度也提高了1.7%。结果表明,RT-YOLO在无人机航空图像目标检测方面优于其他主流模型。
图1:RT_YOLO网络结构图
[文字:张攀]