前言/Forword
本书第一部分研究复杂场景下的小目标检测与识别,这在军用方面具有十分重要的研究意义。该技术将极大地提高军事装备的智能化水平,如卫星对战场的态势感知、导弹末端的精确制导和单兵智能装备升级等。
现有的目标检测与识别技术在理想环境中已经取得了显著的效果,但在更为普适开放的环境下往往无法正常工作。复杂场景下的小目标检测与识别研究面临环境的复杂性、目标特性的复杂性和数据的不完备性等方面的挑战。
该研究需要解决的核心科学问题是源域特征空间和目标域特征空间分布不一致。本书解决该问题的基本思路是在源域知识的指导下,修正目标域样本在特征空间的联合概率分布,从而提高样本目标域特征的可分性。
针对分布不一致的问题,从上下文信息、信息补偿及数据增强这3个方面展开研究,现已取得如下研究成果:
(1)针对环境复杂所引起的前景和背景分离难的问题,本书提出了上下文信息指导的复杂场景小目标检测方法(DLGC),该方法引入上下文信息约束来剔除候选区域中存在的大量背景,从而解决了小目标检测难的问题。另外,在4个公开的数据集中,说明了DLGC方法能够有效地检测小尺寸人脸(简称小脸)和物体。在世界著名的小脸检测数据集——WiderFace和遥感图像物体识别数据集——DOTA中,DLGC方法分别得到93%和61.73%的准确率。
(2)针对由目标特性的复杂性所引起的小目标自身携带信息匮乏的问题,本书提出信息补偿机制的复杂场景小目标识别模型(RL-GAN)。根据该模型学习低分辨率图像的特征空间和其高分辨率图像特征空间之间存在的差异,将这种差异补偿至低分辨率图像特征,以减少其与高分辨率图像特征的差异,从而提升小目标识别的性能。此外,本书将通道注意力机制引入RL-GAN优化过程中,提出基于全局信息通道的注意力RL-GAN,引导网络聚焦于信息量丰富的特征而忽略信息量匮乏的特征,达到小目标特征高效提取的目标。该模型在两个公开的数据集——高分辨率舰船识别数据集和CIFAR-10数据集进行了实验,识别准确率提升了20%以上,错误率降低了6.88%。同时,本书构建了一个专门针对低分辨率舰船识别任务的数据集WIDER-SHIP,RL-GAN相比于残差学习网络,在识别性能上取得了10%~15%的提升。
(3)针对由数据集方向不完备性所引起的模型训练过拟合问题,本书提出了样本方向属性指导的数据增强方法。该方法通过将样本旋转特定角度的方式,使训练样本在方向分布上充分覆盖物理世界中样本方向的分布,以此提升数据方向的完备性,最终减少训练模型中过拟合风险。为了验证所提出的数据增强方法的有效性,本书在PASCAL VOC 2007数据集上测试了RCNN系列模型在目标识别任务上的性能,测试发现在视频监控相机中,该模型的平均识别准确率在使用数据增强后,提高了7.5%。
(4)针对遥感图像大场景难以快速检测的问题,本书结合数据增强方法提出了区域推荐和PHOG的飞机快速检测方法。该方法从减少候选区域搜索空间和特征优化两个角度加速了复杂场景下小目标检测的任务。首先,该方法设计了基于二值范数梯度的编码算法用于封闭对象边界检测,以大大缩小潜在目标区域的搜索空间,从而加快传统的窗口滑动策略。其次,该方法采用更轻量的特征描述符,通过方向直方图的金字塔获得椭圆傅里叶变换的梯度,大大减少学习模型参数个数,从而加速了目标检测过程。相比于DLGC算法,本书提出的小目标检测方法将检测任务的速度提升近20倍。
本书第二部分,以1对1超视距空战为背景,立足于大量空战训练数据,利用机器学习的方法开展了智能空战深层态势感知的研究,旨在从数据化、智能化的角度解决空战态势感知问题。主要研究工作如下。
(1)基于粒子群优化LSTM的空战轨迹预测研究。轨迹预测是空战态势感知、智能空战中的关键问题。传统轨迹预测模型存在模型简化较大、考虑因素较少等问题。结合飞行轨迹连续性、时序性、交互性的特点,提出基于粒子群优化LSTM的空战轨迹预测模型。将目标机的位置、姿态等信息同时作为轨迹预测模型的输入,更加符合真实轨迹变化规律;对建立的基于粒子群优化LSTM的空战轨迹预测模型采用综合考虑动量和速度的自适应调整学习步长的学习算法进行训练;并与基于BP、RNN、LSTM的轨迹预测模型进行仿真对比分析。结果表明:与基于BP、RNN、LSTM的轨迹预测模型相比,所提模型预测误差更小、预测效果更好,可以更加准确地进行目标机空战轨迹的预测。
(2)基于CHCQPSO-LSSVM的空战目标机动识别研究。针对现有机动识别方法的不足,将空战目标机动识别问题等效为数据分类问题,提出了一种基于运动分解和CHCQPSO-LSSVM的识别模型。利用仿真数据对模型进行训练,挖掘出了飞行参数与机动动作之间的映射关系。结合运动分解的思想,构造了机动特征数据,在此基础上构建了机动动作样本库并建立了基于最小二乘支持向量机的机动动作识别模型,利用交叉杂交的混沌量子粒子群算法对模型进行了优化,将优化后的模型应用到态势数据中实现飞行员的机动动作识别,建模过程实现了复杂问题的简单化。仿真实验结果表明,本书提出的识别模型对各类机动动作都可以准确识别,平均准确率可达96%左右,而且连续进行200次识别所需时间约为30ms,可以准确、快速地进行空战目标机动识别。
(3)基于Multi-BiLSTM-Attention网络的空战目标意图识别研究。传统1对1空战中目标战术意图识别过程中仅依据单一时刻进行推理分析,而实际战场中目标战术意图是由一系列动作实现的,因此,目标状态呈现动态、时序变化特征。针对此问题在长短期记忆网络(LSTM)的基础上引入双向(Bidirectional)传播机制和注意力(Attention)机制,但是单一的、固定的BiLSTM只能学习到一个特定维度的信息,因此,我们通过设置不同的BiLSTM,构建了一个Multi-BiLSTM-Attention模型。该模型可以学习到多个维度的带有依赖信息的特征。根据领域专家知识和实践经验,构建空战意图特征集,并将其编码成时序特征,将决策人员经验封装成标签,通过Multi-BiLSTM学习空战意图特征向量中的深层次信息,并利用注意力机制自适应分配网络权重,最后将不同权重的空战特征信息放入Softmax函数层进行意图识别。通过与多种空中战术目标意图识别模型进行对比及实时性实验分析,结果显示所提模型极大地提升了空中目标战术意图识别率,并且具有很好的识别实时性,可以准确、快速地进行空战意图识别。