前言
基于单目视觉的行人检测是城市交通环境下智能汽车辅助导航技术中的一项关键技术,也是目前计算机应用领域的研究热点之一。它对于保障现代城市道路交通安全具有重要的作用,已经引起了各国政府和相关研究机构的高度重视。
本书对行人检测的关键技术进行了概述,阐述了国内外相关研究及进展情况,重点针对复杂城市交通环境下行人检测技术进行了深入研究。
本书的章节安排如下。
第1章首先介绍了研究背景、行人检测技术及面临的问题,然后阐述了基于单目视觉行人检测技术的研究意义、国内外典型的智能汽车系统及研究现状。
第2章概述基于单目视觉的行人检测系统,简单介绍本书的主要实验平台——多功能智能汽车THMR-V及常用术语的定义。
第3章根据Haar-like所提取的行人轮廓特征,利用树形Adaboost算法的简单和高效性,提取图像中可能存在行人的感兴趣区域,为下一步行人的识别提供输入信息。在保证较高检测率的前提下,可以快速地剔除大多数不包含行人的扫描窗口。
第4章介绍了基于Mean-shift的多尺度检测融合算法。基于Haar-like特征和Adaboost的行人候选区域分割算法对目标图片进行扫描、分类处理后,会得到许多互相重叠的检测结果。数目较多的行人候选区域,会加重行人识别阶段的工作负担,因此需要在行人识别之前首先对分割产生的检测框进行合并。在分析了多尺度检测融合算法需要解决的问题和设计原则的基础上,将检测框的融合问题转化为基于窗函数的模型估计问题,提出了基于Mean-shift的多尺度检测融合算法,并通过引入重采样技术提高了检测融合算法的速度。
第5章介绍了基于改进Shapelet特征的行人识别。研究基于形状信息的行人识别算法。在分析现有的Haar-like、Edgelet特征和标准Shapelet特征集的基础上,对标准Shaplelet特征从子窗口的空间分布、归一化方法和底层特征的计算等方面进行扩展。相关实验的结果表明,改进的Shapelet特征与标准Shapelet特征相比,提高了行人识别算法的检测性能。
第6章介绍了基于部位的行人识别算法。针对复杂场景下行人之间、行人与其他障碍物之间的遮挡问题,将改进的Shapelet特征与子结构概念相结合,提出了一种基于部位集成的行人识别算法。首先将人体建模为头部、躯干、左臂、右臂和腿部5个部位的自然组合,从而将对目标行人的检测分解为对5个部位的检测,每个部位检测器采用基于改进Shaplelet特征的检测方法。对于部位检测器的集成,引入子结构来刻画各部位之间的位置、尺度等几何约束。为了获得最优的集成方式,引入了覆盖集概念,在集成检测器的检测率与它的拓扑结构之间建立联系。然后,采用随机搜索的方式从所有的子结构中选择满足覆盖集定义,并且具有最小虚警率的子结构组合来构建集成检测器。最后,利用马尔可夫随机场(MRF,Markov Random Field)理论来完成基于集成模型的行人检测任务。
第7章介绍了基于在线学习的行人检测算法。针对Adaboost离线学习算法的不足,提出了一种应用于行人检测的在线学习与检测框架,该检测框架除了完成行人的在线检测之外,还可以通过对漏检行人样本和错检非行人样本的在线学习,不断提升检测器的性能。相关实验表明,基于在线学习算法的检测器随着学习样本数目的增多,检测性能不断提高,当训练样本足够多时,其检测性能趋近于基于离线学习算法的检测器,并且大大减少了训练时间。
第8章介绍了行人检测技术的研究成果及进一步工作。针对复杂城市交通环境下行人的安全问题构建基于单目视觉的行人检测系统,研究相关的行人检测技术,对取得的研究成果进行总结并展望下一步的工作。
本书的研究工作得到了以下基金的资助:
《多源多模态图像特征融合研究及在自闭症早期诊断中的应用》,国家自然科学基金(No.61773244);
《面向文本分类的迁移学习和半监督学习方法研究》,国家自然科学基金(No.61175053)。
本书的写作也得到山东工商学院计算机科学与技术学院领导的大力支持,在此表示衷心的感谢。
于立萍
2017年10月