第1章 人脸识别概述
本章主要内容
● 人脸识别背景
● 1:1、1:N 和N:N 人脸比对模式
● 人脸识别技术的应用场景
● 人脸识别常用数据集介绍
人脸识别、语音识别、无人驾驶可能是新一代人工智能诸多研究和应用领域中的“显学”,因其最为普通大众所熟知,应用价值可能也最大。本书聚焦人脸识别领域,讲解“刷脸”背后的技术内幕。
视频和图像中人脸的检测、识别和检索技术在当今的人工智能时代发挥着越来越重要的作用。例如,在公安、交通应用中,人群密度高的区域及城市的道路上都已部署了大量的监控摄像头(分辨率多为200万像素的高清数字摄像机),实现对目标人物(如可疑人物、犯罪嫌疑人)及其活动轨迹的全自动识别和检索,在公安和交通等应用中具有极其强烈的现实需求(目前主要通过人眼对视频进行人工分析,即办案人员用眼睛盯着视频逐帧查看,这一过程通常极为耗时)。要想实现对这些视频的全自动、智能分析,就需要准确地对人脸进行检测、识别和检索。而人脸检测、人脸识别和人脸检索,是当今的人工智能技术在商业应用中迫切需要解决的现实问题之一。本书以实例为驱动,从应用的角度全面介绍、讲解、分析人脸检测、人脸识别和人脸检索问题中的经典算法及其应用。
人脸检测、人脸验证和人脸识别是三个容易混淆的概念。通俗地讲,人脸检测是定位人脸区域,人脸验证是验证两张图像中的人是不是同一个人,人脸识别是从多张图像中识别这个人的身份(这个人究竟是谁)。换句话说,首先需要在图像中检测出人脸的区域,即人脸检测,然后使用人脸识别的算法,识别出图像中的人到底是谁;而人脸检索是指给定一个或多个包含人脸的输入图像,从图像库中检索包含输入图像中的人脸的那些图像。近年来,随着深度学习的发展,使用大量有标记的人脸图像训练人脸检测、人脸关键点定位和人脸识别模型,能够更加准确地提取人脸特征,用于人脸的检测、识别和检索。
需要说明的是,尽管现有算法在LFW 等公开数据集上取得了95%甚至更高的准确度,但人脸检测、人脸识别与人脸检索尚未很好解决。事实上,现有的公开数据集远不能代表真实应用场景。由于在无约束场景下的侧脸、不同姿态、光线变化、表情变化等因素,现有的人脸识别技术还达不到满意的程度。正如中科院自动化所刘成林研究员所言:“在室外自然光照条件下,人脸识别正确率还达不到50%。”事实上,多数人脸识别产品都要求正面照。由此可见,目前解决较好的仅是正脸识别的问题,而室外无约束环境下的人脸识别技术尚未成熟。