中科院专家山世光:全民刷脸支付尚需时日
http://finance.caixin.com/2015-07-01/100824334.html?utm_source=baidu&utm_medium=caixin.media.baidu.com&utm_campaign=Hezuo
中科院专家山世光:全民刷脸支付尚需时日2015年07月01日 16:18 来源于 财新网
随着人脸识别技术的成熟,未来五年内或可广泛应用。但中科院专家认为,即使国际权威人脸识别数据库LFW的测试准确率达到99.5%,并不等于人脸识别技术在所有应用场景下都成熟了,比如人脸识别在金融、安防等场景中的很多应用尚不成熟,实际上还有很长的路要走
http://img.caixin.com/2015-07-01/1435743123447036_480_320.jpg当地时间2015年3月15日,德国汉诺威,阿里巴巴创始人马云在CeBIT开幕式上,演示了蚂蚁金服的Smile to Pay扫脸技术。 OLE SPATA/东方IC
【财新网】(记者 张宇哲)
2015年以来,腾讯、阿里等多个IT巨头及上市公司纷纷加码布局人脸识别产业,并希望将人脸支付技术的应用延伸到金融业务领域。
今年3月,阿里巴巴集团董事局主席马云在德国参加活动时,曾演示蚂蚁金服的Smile to Pay扫脸技术。这项支付认证技术由蚂蚁金服与Face++ Financial合作研发,在购物后的支付认证阶段通过扫脸取代传统密码。这意味着,未来可以实现“刷脸支付”。支付宝宣称,Face++Financial人脸识别技术在国际权威人脸识别数据库LFW国际公开测试集中达到99.5%准确率,同时,还能运用“交互式指令+连续性判定+3D判定”的技术。 近日最新消息是,腾讯的优图团队向LFW提交了在无限制条件下人脸验证测试中的最新成绩是,99.65%。这一结果打破了之前Facebook,Face++、Google等团队创造的纪录。 此前腾讯旗下的财付通曾表示,已与中国公安部所属的全国公民身份证号码查询服务中心达成人像比对服务的战略合作。腾讯与微众银行正在对金融、证券等业务进行人脸识别的应用进行尝试。财新也同时获悉,阿里、腾讯已计划把刷脸支付技术在年内进行市场应用。 6月28日,在北京国际财源中心,由“未来论坛”联合举办的,题为《计算机视觉:从刷脸到认万物”主题讲座上,中国科学院计算技术研究所研究员山世光博士详细介绍了人脸识别技术在国内外的发展史,并澄清了外界对人脸识别技术的误区。他表示,“必须说明的是,尽管现有人脸识别技术在LFW等人脸数据库上的准确率已经达到99.5%,但这不等于人脸识别技术在所有应用场景下都已经成熟了。总体上人脸识别在金融、安防等场景中的很多应用尚不成熟,还有很长的路要走。” 他以马云在德国展示刷脸支付的图片展示为例,“从图片展示看,系统界面中央有一个头肩轮廓,从技术角度来讲,其实是为了让刷脸的人尽可能配合的把自己的脸放在这个区域里面去,以保证识别的成功率;从某种意义上,已经说明这个技术还没有成熟到可以随便照一下,就可以成功识别出来的水平”。 他极其强调人脸识别技术的科学评价问题。他说,“某些公司宣传自己的人脸识别系统的识别率达到了99%,其实单纯看识别率这个指标的高低并无太大的意义。”山世光指出,即使一套识别系统性能很差,人们也可以造出一个人脸数据库,保证该系统在这个库上的识别率高达99%,“如果不指明测试用人脸数据库的规模(包括人数和图像量)、拍照环境(如光照变化)、测试库中图片的质量(如分辨率和噪声指标)、以及拍照时的人脸姿态和表情变化等情况,单纯看识别率指标的高低,是没有意义的”。 更为重要的是,评价一个识别系统的好坏,除识别率指标外,还必须同时考虑误识率或虚警率等其他指标,就是把不是张三的人错误识别为张三的概率。 虚警率是指设置低而产生的错报,多用于目标人监控场景,当目标人没有出现而报警就是虚警。在人脸识别等生物识别技术中,是将现场人脸采样和数据库中已注册人脸的相似度比较,判断结果依靠阀值的设定;阈值设置低虚警率就高,设置高虚警率就低。 山世光亦乐观地表示,随着技术进步,预计五年之后,刷脸支付可能会成为一种比较普遍的支付方式。 山世光主要从事计算机视觉、模式识别和机器学习等相关研究工作,特别是与人脸识别相关的研究工作。他负责的课题组完成的识别系统多次获得国内外人脸识别竞赛第一名,并成功应用于上海世博会、电子护照照片查验系统等。 技术优与劣 “深度学习”是人工智能界当前最为炙手可热的前沿技术之一,其应用于计算机视觉取得了极大的成功,从而带来了众多的产业应用可能。Google在2014年收购的4 家人工智能初创公司均涉及“深度学习”技术,其中的3家则涉及计算机视觉技术。阿里、腾讯的人脸识别技术应用也得益于“深度学习”技术。 据山世光介绍,“深度学习”是近年来被重新发扬光大的一种多层神经网络技术,配合结合大数据的研究,将LFW人脸库上的分类错误率从3年前的5%降到了现在的1%。在上个世纪80年代就已被提出,其核心算法的大多数技术模块当时已经出现,近年来由于大数据的涌现、大机器以及GPU的普及、以及业内对大规模优化算法的持续研究,才使得神经网络技术获得了新生,并在图像分类和识别、语音识别等领域取得了巨大的成功。 他介绍说,现有人脸识别技术大多遵循这样的技术流程,即将待识别的人脸照片或视频,与之前已注册、存储在计算机中的已知身份人脸照片或视频进行匹配,以计算它们的相似度。这类系统的大概流程一般包括:一是在图像中找到脸的位置(即人脸检测),二是找面部关键特征点,三是提取特征。 他表示,同一人在拍照或摄像时,由于姿态、表情、光照、年龄等的变化,拍出来的面部图像在信号层面差别非常大。不同的人在相同的拍摄条件下,拍出来的照片在信号层面反而可能会非常相似。这正是自动人脸识别要解决的关键挑战之处,既能区分不同的人、又兼顾各种采集条件的变量因素,是人脸识别技术中最核心的模块,也是目前“深度学习”的优势。 山世光进一步分析称,总体上,在采集环境可控、用户配合的一些特定应用场景下,当前的人脸识别技术已基本成熟,如民用级的考勤和门禁系统,证件照之间的比对查重系统等,其中后者用于护照或身份查重,已经非常有效地遏制了多重身份假证件泛滥的问题。如果某人之前曾办过护照,现在又试图以另外一个身份再违法申办一本新的护照,现有人脸识别比对系统就可以把其之前的护照比对出来,从而阻止其获得假身份。 但是,山世光强调,人脸识别在金融、安防等场景中的很多应用尚不成熟。如金融领域的刷脸支付系统,安防领域安全等级高(如银行金库)的出入口控制系统、人证一致性验证系统、黑名单目标人监测报警系统等。以黑名单目标人监测为例,在虚警率万分之一的条件下,首选正确识别率可能只有30%甚至更低,而对安防用途的人证一致性验证(即判断持证人是否为本人)系统而言,在误识率为千分之一时,拒识率可能达40%或更高。 他援引今年IEEE FG2015举行的PaSC测试结果。该测试的任务是对比两个接近监控场景的视频片段中出现的是否是同一个人,该场景比上述安防等应用场景还要容易得多。即使如此,这个测试结果表明,在虚警率高达1%的情况下,山博士团队所开发系统的正确验证率也只有58%左右,而这已经是此次测试的最好成绩。 “这说明类似场景下的人脸识别问题远没有得到很好的解决”。再比如整容和双胞胎问题,他认为也是没有得到全面解决的。尽管有些系统在媒体上展示其可以区分几对双胞胎,但这并不能代表双胞胎识别问题解决了。“更科学严谨的做法应该是找数百甚至上千对双胞胎做大量测试,形成详细的误识率和识别率ROC曲线报告,方可得出可信的结论”。山世光强调。 技术挑战 至于刷脸开户和刷脸支付技术,山世光表示,目前从技术的成熟度来看,主要涉及两个问题:第一,存在权衡便利性和安全性的困境。假设客户在非银行现场开户,他向系统提交身份证信息,系统从国家身份证中心获得二代证照片和这个开户人比对,判断其是否为该证件的合法持有人。山博士预测,“这种场景下,如果要保证安全性,误识率可能要低于0.0001,而此时识别率可能只有70%左右,这意味着100次刷脸可能有30次不成功,会很不便利。而要提高识别率以增加便利性,势必要把误识率调高到0.001甚至0.01,而这又会带来易于被冒用身份的严重安全问题。这张二代证照片很可能是十年前拍摄的,而刷脸支付现场采集环境又非常复杂、多样、不可控”。 当然,在他看来,客户在合法开户后刷脸支付的技术难度可能相对好一些,因为用户在开户时拍摄的照片(可以不止一张)可以作为这个人存底数据库的照片,可以配合二代证照片同时用于验证支付现场的客户照片,在这种场景下下,如果误识率设定在比较安全的0.0001,识别率有可能达到90%或更高。 山世光表示,第二个问题则更严重,即假体欺骗问题,“这是刷脸支付可能面临的最大的技术挑战”。他强调,刷脸支付一旦普及,必定会有不法分子用照片、视频甚至制作三维头套等高科技手段来欺骗刷脸支付系统,非法获得财富。从目前技术水平来看,尽管科技界已经开发了眨眼、唇动或3D等多种防欺骗技术,但都还不是无懈可击的。所谓“道高一尺、魔高一丈,比如你说话可以被诈骗者录音,也可以生成带有你的眨眼或唇动的视频,甚至可以制作与真人无异的3D头套,以欺骗人脸识别系统。” 在一位研究人脸识别的公安部三所专家看来,即便人脸识别技术成熟了,在互联网远程环境下,也无法防范黑客的重放攻击,即信息可以被黑客截取,可以被复制、被重放,“只要是网络远程方式就不可能超越密码技术,这是业内最大的误区”。这位人士强调。 生物识别技术的难度和风险 山世光表示,人脸识别应用场景的难度取决于多种因素。从根本上讲,这种难度决定于在注册系统时的照片和后来识别时的照片之间的差异,差异越大难度越大,差异越小难度越小。比如,被识别者在拍照时不配合就会增加识别难度。 还有一个因素与你在注册时用几张照片有关系。如果系统里注册了你的很多照片,系统会认为你是“熟人”,识别就会相对容易。但如果只注册一张照片,“打个比方,如果只给你一张照片让你去机场接我,不告诉你我的航班号,你会很难认出我”。山世光举例称。 拍摄的照片质量差,也会增加识别难度。比如人在走动时导致拍摄的照片有运动模糊,或者摄像机装的位置不好导致拍摄的照片都是侧面的,也会增加识别难度。还有一个非常重要的因素是光线,“人们常忽略光线问题,过曝、欠曝、逆光、偏光都会导致人脸特征的失真”。 据山世光介绍,可以用于身份识别的生物特征识别技术,除了人脸识别,指纹技术更早于人脸获得应用,还有虹膜、掌纹、手形、脚印等,实际上,“相对于人脸识别技术,指纹和虹膜是更成熟的技术,只是其可用的应用场景与人脸识别有较大差异,在监控等场景下几乎不可能采用”。 他进一步介绍,生物特征除了生理特征之外,还有声音、步态、签名、走路的方式、敲击键盘的方式等等,“不过,声音识别相对成熟一些,签名识别难度较大,步态识别则更不成熟”。近年来,还出现了一种新兴的静脉识别技术,用手背或手指上的静脉分布作为特征区分不同的人,相比其他生物特征,静脉识别有活体检测的便利优势,因为被识别者本身必须是一个活体,“只有活体、有血流之后才能测量出来”。 在山世光看来,每一种生物特征识别技术都有它的优缺点和风险。比如说指纹识别,在淘宝上花30块钱买一个指模,就可以替别人打卡或者让别人替你打卡,或者做一些违法的事情。“静脉识别技术还没有广为推广,普及后也会有相应欺诈的手段产生,比如可能有人会造出模拟血液流动的假体”。 一位业内人士亦举例说,现在已经诞生了人工智能机器人,如果你的瞳膜DNA被盗用在这个机器人身上,这个机器人的行为记录就可能取代你的一切真实行为。目前,世界各国都对建立DNA数据库持非常谨慎的态度,出于对隐私信息的保护,各个国家都有相关法律,一般是由政府来推动生物识别技术。■
页:
[1]