欢迎光临
我们一直在努力

百度AI寻人

关于案例背景

“百度AI寻人”项目是2016年底百度推出的一项AI公益服务,探索用人工智能技术帮助找到走失或被拐儿童回家。2017年,百度与民政部的全国救助寻亲网合作,推出基于人脸识别技术的AI寻人平台。首批接入全国救助站内3万多条走失人员数据,实现家属上传走失人员照片后即可一键对比库内所有照片,系统自动给出相似度最高的十个结果。

此外,宝贝回家志愿者协会作为在民政部门正式注册过的民间志愿者组织,其下的宝贝回家寻子网站在中国寻亲领域有较大的影响力。但是在技术层面,特别是“人脸识别比对”等人工智能的应用上需要外部技术公司的支持。宝贝回家平台上有两个照片库:走失孩子寻找父母的“宝贝寻家”和父母寻找孩子的“家寻宝贝”,因此如何将两个数据库中的照片进行匹配,找出相似的照片,是至关重要的一环。之前人工力量来完成,费时费力,而且人眼非常容易产生纰漏,再者最为关键的便是跨年龄段的人脸比对工作,如何用技术解决这一问题,成为百度发力的关键。

百度“AI寻人”项目利用深度学习技术进行人脸特征的提取,通过度量学习的方法,在大规模人脸数据训练模型基础上,与走失儿童数据库中的照片进行实时对比,使用跨年龄数据进行针对性优化,即使儿童走失多年,在跨年龄人脸识别技术的帮助下也有机会实现重聚。

关于技术方案的具体措施

百度应用跨年龄段人脸比对技术,寻找高度疑似案例,并交给志愿者团队进行实地调查与追踪。这个过程看似简单,背后却需要从算法到筛选、标注等各项技术支持。开展合作后,百度IDL(深度学习实验室)、AIP(AI平台部)、AIQA(AI测试部)、众测(平台测试部)等多个部门的十几位技术同学成立了“AI寻人”虚拟团队,同时为了确保跨年龄段人脸比对技术的准确性,百度通过动员所有的百度员工贡献自己小时候的照片,以此来不断训练相关模型,确保识别技术的稳定性。

2019年初,“AI寻人智能小程序”上线,简单上传一张照片,就能与民政部全国救助寻亲网及宝贝回家等平台的数万条走失人口数据进行一键比对。同时,小程序增加了寻亲登记模块,有寻人需求的用户在登记后,信息可实时推送到寻人服务机构后台,从而大大提升了实时寻亲的效率。通过“搜索+信息流”的双重加持,智能小程序即搜即得、无需下载的特性,更方便触达有需求的人群。2020年9月,百度将小程序进一步升级,增加了信息推送和网友助力两大功能,帮助更多有潜在需求的用户了解和获取寻找丢失被拐卖的儿童服务。

百度AI选用度量学习方法来进行识别算法研发,并搭建了一套完整的比对流程。

微信图片_20220621111837

图1 人脸特征提取流程

如上图所示百度搭建了一套人脸图片特征流程,包括以下几个步骤:

(1)人脸检测(FaceDetection):人脸检测器负责从原始图像中找到人脸的位置,以便于后续的特征分析。百度人脸算法团队研发了一种语境辅助的pyramidbox人脸检测,引入基于anchor的上下文辅助方法,尺度感知的Data-Anchor-Sampling方法,中稿当年顶级计算机视觉会议ICCV,多次刷新人脸检测最权威榜单WIDERFace世界纪录,后不断迭代Box系列方案,在2019年WiderChallenge竞赛中获得冠军。

(2)人脸对齐(FaceAlignment):人脸对齐是根据一组预定义的参考坐标对人脸图像进行放缩和裁剪,从而使所有输入人脸的五官处于一个标准的位置。这一过程中首先需要使用人脸关键点检测器找到图像中的人脸关键点坐标,然后计算从原始坐标到参考坐标的最佳仿射变换。百度的关键点检测模型也获得了2019ICME人脸关键点检测比赛冠军。

(3)人脸特征提取(FaceRepresentation):在人脸特征表示阶段,由像素表示的原始人脸图像经由特征提取算法被转换为密集且具有区分度的特征向量,这也称为模板(Template)。理想情况下,属于同一人物的所有人脸图像都应该被映射到特征空间中的相近位置。

(4)人脸特征匹配(FaceMatching)。人脸匹配构建块中对输入的两个人脸特征向量进行比较并输出相似度分数,以表明它们属于同一人物的可能性。基于DCQ人脸识别算法,并使用超过2亿张图片的数据进行训练,百度人脸识别准确率已达到99.7%。在一些特殊的场景中,人脸识别技术已成为寻亲过程中不可替代的重要工具。DCQ人脸识别算法已被计算机视觉峰会CVPR2021录用。

微信图片_20220621111842

图2 整体系统架构图

微信图片_20220621111845

图3 首页界面图

百度AI寻人平台是面向全社会的公开平台,有寻亲需求的用户均可通过平台发起寻人消息,以及进行照片的比对服务,不会根据用户的年龄、性别做歧视性的限制操作行为。

百度在进行AI算法设计时,会充分考虑算法安全性,在发布新算法或算法存在重大更新时,内部会主动发起安全评估申请,由安全部进行技术支持。

关于应用效果

截至2021年3月1日,百度AI寻人平台共计收到用户上传照片42万余张,寻亲成功数量达到12000多人次。用人工智能切实保护儿童权益,呵护儿童成长,守护千万个普通家庭的幸福,真正响应人工智能为儿童的全球主张。

此外,以人脸生物信息为例,人脸生物信息被复制概率较高,倘若人脸生物信息被不法分子掌握,利用人脸信息进行网络支付,或者冒用、贩卖他人信息都会给受害者带来极大的财产损失和人身安全。因此,作为基于人脸信息进行比对的服务,注重保障生物信息隐私。首先,对采集图片进行base64编码操作,把图像转为字符串,隐藏视觉信息。再通过深度神经网络对图片字符串进行建模,其中包括随机丢弃(dropout)、非线性映射等不可能逆操作,防止从建模特征恢复原始的生物图像信息。同时为了进一步保障数据安全,对建模的特征进行加密操作,减少特征开放带来的安全隐患。经过上述的图片编码、非可逆建模和特征加密三个操作,有效的解决了生物信息安全和隐私问题。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。