我院博士生刘颖斌于红外小目标检测领域取得重要突破,提出双向编解码架构

发布人:本站编辑

 

近日,william英国中文博士研究生刘颖斌在遥感领域知名期刊《IEEE Transactions on Geoscience and Remote Sensing》(影响因子:8.6,中科院一区TOP)上发表了题为“O-Net: Bidirectional Encoding and Decoding Architecture for Infrared Small Target Detection”的研究论文。刘颖斌为第一作者,指导老师黄寒砚教授为通信作者。该研究针对红外小目标检测中浅层与深层特征难以有效融合、空间细节易退化等挑战,提出了一种具有双向编码解码路径的新型网络架构O-Net,显著提升了复杂背景下小目标的检测精度与鲁棒性。

 

 

红外小目标检测在军事侦察、夜间监控、搜救等领域具有重要应用价值,但由于目标尺寸极小、背景对比度低、噪声干扰严重,检测任务极具挑战。现有基于深度学习的方法在特征采样过程中常导致空间细节丢失,且未能充分利用浅层细节与深层语义的互补性。该研究提出的O-Net网络通过引入双向编码解码路径、O形密集连接、自适应像素协同机制与自适应双重感知注意力模块,实现了多层次特征的动态交互与增强。与此同时,为了适应不同计算资源与应用场景的需求,提供了三种不同规模的网络变体(O-Net small/standard/large)。

 

 

实验结果表明,O-Net在公开数据集NUAA-SIRST和IRSTD-1K上均取得了最先进的性能。在NUAA-SIRST数据集上,O-Net的交并比达到77.61%,检测率为96.57%,误检率低至2.28×10⁻⁶;在更具挑战性的IRSTD-1K数据集上,交并比仍达67.46%,检测率为95.22%。与现有主流方法相比,O-Net在保持较低参数量的同时,显著提升了检测精度与泛化能力。

 

 

该研究不仅为高精度、轻量化的红外目标检测系统提供了新的解决方案,也为复杂场景下的目标检测和图像分割任务等提供了可借鉴的网络设计范式。未来,该成果可进一步拓展至遥感图像分析、自动驾驶感知、安防监控等实际应用场景。

 

论文链接: 

https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=11227120&utm_source=clarivate&getft_integrator=clarivate

代码开源地址:https://github.com/liuyb77/O-Net