10月28日,以人工智能为主题的“OFweek 2020(第五届)人工智能技术创新论坛”在深圳成功召开。会上,清华大学电子工程系苏光大教授就算法、系统、标准、应用四方面深度讲解了人脸识别技术的发展态势。
图片来源:OFweek维科网
人脸识别的数据安全
人脸识别技术在我国起步较晚,但发展很快,目前已达到国际领先水平。
人脸识别技术在国家安全、社会公共安全中具有非常重要的意义。如今人脸识别技术已广泛应用于各个行业,其中在安防、金融行业中的体现尤为“突出”,已经形成了应用大潮。
在当今社会,随着人脸识别的广泛应用,人脸识别的数据安全也成为大家关注的焦点。
人脸数据,包括原生人脸数据、派生人脸数据。人脸特征数据,属于派生人脸数据。
人脸识别应用的健康发展,离不开人脸数据的安全管理。我们要规范人脸识别的应用、确保人脸数据的安全、正确看待质疑的评论、促进人脸识别的健康发展。
人脸识别应用的安全性非常重要,而这种安全性既包括人脸数据的安全,还包括防假体攻击的安全。目前,在国家标准、公共安全行业标准层面上,人脸数据安全管理规范的相关标准也正在快速制定中。同时,人脸识别应用中的防假体攻击方面的相关国家标准也正在制定。可以说,人脸识别的应用安全,也是人脸识别技术发展的一个重要组成部分。
人脸识别技术的核心技术
人脸识别是一种基于人脸特征信息进行身份识别的生物特征识别技术。
前期的人脸识别算法我们一般称为常规方法,如特征脸人脸识别方法。现在的核心算法主要是深度学习人脸识别方法。
深度学习是人工智能的突破性技术。深度学习应用于人脸识别,取得了高识别率的显著效果。比如基于二代证的实名身份认证,采用常规人脸识别算法,2008年达到的水平是:错误接受率为0.1%时,正确识别率仅为80.81%。采用深度学习人脸识别算法,现在达到的水平是:错误接受率为0.01%时,正确识别率≥97%。
2005年,国家十五攻关项目“人脸识别查询技术”通过科技成果鉴定。该项目研制成功的TH-2005人脸识别系统,采用了内存计算技术、集群计算技术、MMX加速技术,在256万特征库中,实现了1秒内识别查询。该系统奠定了我国海量人脸识别系统的系统架构基础。2008年,我国建成千万级特征库人脸识别系统;2012年,我国建成亿级特征库人脸识别系统;现在人脸识别系统的特征库最大规模已经超10亿。
具有影响力的人脸识别应用
由于人脸识别的便捷性、摄像头的普及性、第二代居民身份证包含的人脸图像数量的规模性以及人脸识别在公共安全中应用的有效性,我国人脸识别技术的应用风生水起,已形成应用大潮。
我国人脸识别的应用大致是按照辨识型人脸识别、确认型人脸识别、关注名单型人脸识别的顺序逐步展开的。
2000年左右,辨识型人脸识别系统率先应用于公安部门。随后,有影响力的应用层出不穷。
2008年,上百套确认型人脸识别系统应用于2008年北京奥运会。这是国际奥运史上第一次应用人脸识别技术。该应用被媒体誉为是人脸识别技术在华发展的里程碑。
人脸识别应用于视频图像侦查,在周克华案(如2009年3月19日,周克华在重庆某部队的岗亭,抢杀哨兵、抢枪和2012年1月6日,周克华在南京某银行门口,枪杀某公司员工,抢走现金19.99万)以及在其他一些疑难案件中,人脸识别发挥了重要作用。
2012年左右,在公安工作的推动下,我国出现第一次人脸识别应用高潮,即公安厅、局等单位纷纷建立了辨识型人脸识别系统,完成了户籍人脸特征库的查重、查异等业务,取得了人脸识别应用的重要成果。
在平安城市、雪亮工程的推动下,2015年左右,深度学习的关注名单型人脸识别系统广泛应用于视频人脸识别,在追逃等业务中取得了人脸识别应用的重要成果。由此,我国出现第二次人脸识别应用高潮。
当前,AI芯片已经应用于人脸识别。如:基于海思Hi3559芯片的人脸识别、基于云天励飞DeepEye1000芯片的人脸识别。
AI芯片的人脸识别,正在逐步形成人脸识别应用的第三次高潮。
人脸识别技术发展的瞻望
虽然人脸识别无论在算法层面还是在系统层面以及在相关标准的层面上都取得了长足的进展,但人脸识别技术仍在发展,如三维人脸识别、防假体攻击、戴口罩墨镜的人脸识别等等。除此之外,还存在一些极具挑战性的难题。
《MIT科技评论》将微型人工智能列为2020年十大突破性技术。显然,AI芯片人脸识别,正是微型人工智能应用的耀眼之星。
在AI芯片人脸识别系统的设计中,要努力改善冯 · 诺依曼内存墙的难题,以提升有效算力。所谓冯 · 诺依曼内存墙,是指运算单元存取存储体数据,存在速度和数据数量严重不足的问题。当运算单元增多,存储体供应不上数据。另一方面,运算单元处理的多个数据结果,也难以高效的存入存储体,形成数据堵塞,导致处理器的处理速度变缓。
推倒冯 · 诺依曼内存墙问题成为AI硬件系统的难点。
当前,人工智能硬件的架构创新已成为人工智能核心技术的竞争焦点。目前已出现存算一体(Process in-memory)的硬件架构和算存算一体的二维计算(2D Computing In Algorithms-Memory-Process)的硬件架构。赛灵思公司的自适应计算加速平台和清华大学的类脑计算天机芯片,在某种程度上采用了存算一体的硬件架构;清华大学的NIPC-3邻域图像并行计算机,采用了算存算一体的二维计算的硬件架构,该成果曾在大邻域图像核和邻域图像处理的速度上优于当时可查到的国际最好水平。这些技术有效的改善了冯 · 诺依曼内存墙问题。
在海量人脸识别系统的应用中,一个问题是计算规模大。
例如,某公司成功设计的某省人脸识别大数据应用平台。其中,采用了40台GPU服务器组成解析中心。这是该公司的成功应用。成功应用的反思是:今后我们能不能降低这个计算规模?CPU+GPU的主流架构存在的功耗大、运营代价高的难题如何解决?这是人工智能硬件架构创新面临的一个新课题。清华大学某实验室拟采用算存算一体的二维计算硬件架构,以硬件集群的方式,来实现海量人脸识别。目前做了一个初步的实验,在单路板上,可在百万人脸特征库中,实现人脸特征比对和排序,耗时约为0.6s。这个实验,表明人工智能硬件集群有能力解决目前海量人脸识别系统的功耗大、运营代价高的难题。
当前人脸识别的另一个难题是超低人脸分辨力的人脸识别。这是指人脸图像太小的识别难问题。
人脸分辨率是指人脸两眼间距的像素数。最低人脸分辨率可能会成为视频人脸识别的一项重要的性能指标。2013年,关注名单型人脸识别的最低人脸分辨率为30像素。2020年,最低人脸分辨率可达到12像素。目前的研究是实现更低人脸分辨率的人脸识别。
今天的人脸识别,仍然在向纵深方向上发展。我们希望人脸识别健康发展,期待人脸识别学术问题的回归,也期待人脸识别普适性的提升。同时,我们更加期待出现新的计算模式,减少诸如深度学习训练过程的超大计算规模、减少海量人脸识别系统的超大计算规模。