应用层下的人脸识别(二):人脸库
本文作者根据多年人脸识别项目经验,总结了人脸识别技术在安防、商业领域应用及产品设计细节,汇总成应用层下的人脸识别系列文章。
本文为系列文章的第二篇,介绍人脸库的相关内容。人脸库是人脸识别的基础,建立人脸库往往是人脸项目的首要任务,全文围绕着什么是人脸库及如何建立人脸库展开讨论。
1. 什么是人脸库
简单来讲,人脸库就是人脸数据的储存管理中心,能够为人脸识别提供比对模板,为抓拍人脸数据提供管理空间,为人脸算法检测提供测试样本。人脸识别项目是建立在人脸库的基础之上,所以人脸识别的首要任务便是是建立人脸库。
人脸库按照用途可分为人脸比对库、人脸抓拍库、人脸数据集,不同类型人脸库的组成、结构、作用也有所不同,下面将会依次介绍,本文重点讨论人脸比对库。
1.1 人脸比对库
人脸比对库主要用于人脸1:N识别,如下图,人脸1:N是将人脸抓拍照片的人脸特征与人脸库中所有人脸特征进行逐一比对。
人脸比对库主要由人脸库管理、人脸数据、人脸库属性描述三部分组成,如下图:
人脸比对库按照应用场景又可分为四类,分别是黑名单库、白名单库、红名单库和灰名单库。
(1)黑名单库:黑名单指需要重点管控、关注的人员,一般由在逃犯、惯犯、水客、异常行为或是想要重点关注的人员构成。比中黑名单中会产生报警提示,常用于公安追逃;
(2)白名单库:白名单一般指可信人员,常用于商业领域中的通行管理,白名单中的人员容许进入通过。例如在楼宇内设置人脸识别门禁,只容许公司内部人员进入,于是可将公司员工设置成白名单,白名单一般不会触发报警;
(3)红名单库:红名属于白名单的拓展应用,用于白名单中需要重点关注展现的人群,如VIP客户、领导人等,可在识别后进一步分析该人群的行为特点和活动范围;
(4)灰名单:介于白名单和黑名单之间,是一类具有异常行为的可疑人员,还需要通过更多数据分析他们是否是黄牛、小偷、罪犯同伙等。
1.2 人脸抓拍库
人脸抓拍库是管理人脸抓拍数据的地方,在视频流或图片流中凡是能被算法检测到的人脸都会经过图像处理形成一张张人脸的抓拍照片及对应的场景照,再将抓拍照片进行数据结构化并与其场景照一同保留至人脸抓拍库中。
抓拍库的人脸照片会具有性别、年龄、戴眼镜、胡须、表情、是否戴帽子、是否有遮挡等图片描述,方便抓拍照片的检索及深层次人脸数据应用。
人脸数据分为结构化数据和非结构化数据,人脸结构化数据指将原始采集数据按照规则处理,形成具有统一格式,并用数据库二维逻辑表来表现的数据。
如下图:抓拍库储存的是结构化数据,人脸结构化数据指原始人脸数据经过程序分析和过滤,形成具有统一格式和描述的数据储存在数据库中。
1.3 人脸数据集
人脸数据集就是用于检测人脸算法效果和训练算法的数据库,网上有很多公开的人脸数据集可为模型训练提供数据来源。
常见的人脸数据集可见下表:
人脸识别
人脸检测
人脸表情
人脸年龄、性别
2. 如何建立人脸库
人脸库中人脸比对库的建立最为为复杂,这里只讨论人脸比对库的建立过程。
2.1 梳理入库流程
人脸入库流程见下图,人脸数据包含人脸特征向量,人脸信息两部分,它们储存在数据库不同的表中,注意在删除人脸库照片时一定要删除它对应的特征向量。如果照片质量未达到要求,且没有更好的照片,可以有强制入库的选项。
2.2 制定入库规则
人脸数据的质量关系到人脸比对的效果,尽可能将人脸清晰、正脸、本人近期的人脸照片入库。在人脸入库时,产品经理需要制定入库规则来过滤质量不佳、格式不规范的人脸数据。
入库规则应该包含:
- 图片的颜色:可支持彩色及灰度的图片,最低要求256灰度图片;
- 图片的格式:各类主流图片格式,例如 bmp/jpg/png等,图片命名格式统一,如常用的命名“姓名_证件号”;
- 图片像素:双眼中心之间的距离大于30像素;
- 图片尺寸:尺寸大于70X80以上;
- 人脸角度:人脸左右偏转30度以内,上下偏转20度以内;
- 入库图片大小建议几十KB~几百KB之间为宜,但也不能太大,超过1M,会影响入库和识别的速度。
2.3 设计人脸库功能、及界面
人脸库应包含人脸信息的增、删、改、查等基本功能,人脸库界面可参见下图的样式:
人脸信息可以从客户端批量导入,客户端需要提供人脸批量导入模板,批量导入适合小规模格式统一的数据。
当人脸项目中需要入库数万以上的人脸信息,并且人脸数据格式并不统一,整理起来很麻烦,这时就需要设计批量入库工具。
新建的人脸库需要设定人脸规模,一般分为<1W、1W-100W、100W-1000W、>1000W四个范围,大库容进行人脸比对需要更高配置服务器,服务器配置与图像处理能力的关系将会在后续文章中详细讨论。
2.4 采集人脸库数据
如果想通过人脸识别技术识别某人,就需要先获取到该人的人脸数据,并录入人脸库中作为比对模板,那么如何采集人脸库数据呢?采集方式依据使用场景而定。
公安类项目,人脸数据提供方是公安,公安内部有大量的人脸数据,可通过对接公安信息资源库来获取人脸数据,如下图为八大公安信息资源库。
公安的信息资源库是严禁外泄的,对产品的网络安全及数据保密性要求颇为严格,在产品设计时需要考虑到相关问题。
刷脸通行或新零售类项目,一般是用户配合式采集人脸信息,需要设计人脸信息采集入口,用户可在微信公众号、手机app或PC端进行注册时上传人脸信息。
大型商业类或平安城市项目中,需要设计非配合式采集人脸信息。一般会通过在主要出入口、通道、走廊等地部署的人脸抓拍机,抓拍路人人脸,自动建立该人档案库,这里需要用到一人一档,作者会在后期文章详细讨论。
以上就是系列文章的第二篇-人脸库的相关内容,后续将会推出人脸识别系列文章,欢迎大家与我交流图像识别相关问题。
相关阅读
本文由@阳春柏樰 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
人脸库的界面看不清啊?
人脸库除了业务黑灰白名单,还有识别效率上的考虑,单库都尽量小于1万.那么怎么划分人脸库呢?
人脸数据集也不需要在产品层面进行后台设计了吧
如果是保险行业的人脸核身,则是直接和身份证的高清证件照进行比对,这种的就不需要进行人脸库的录入和采集了吧。就是文中提到的人脸库的设计。
您好,我是人民邮电出版社编辑,想与您合作相关内容,可否详谈18811565025
您好,可以加微信“阳春柏樰”聊聊
写的很详细,学习了