身份证作为居民身份的象征,已深入到生活的方方面面,成为人们生活中不可缺少的证明文件,肩负检查、监管职能的机场、海关、边检、交通和公安等部门面临处理和管理大量证件的压力:在机场、海关、边境、对身份证的例行检查,是公安机关缉捕罪犯、阻止犯罪、进行资格审查的重要手段;旅客住宿进行身份证登记,可使公安部门通过身份证信息,获得负案在逃人员、犯罪嫌疑人员的去向,从而达到抓获罪犯、侦破案件的目的;户籍管理身份证登记等。如何利用计算机技术,使登录的身份信息完整、高速、有效,利于管理和验证是各业务系统中首要解决的问题。
身份证采用OCR技术进行识别,识别中主要面临的难题是:
1、身份证的图像背景复杂:身份证是由网纹、激光防伪标识再加有用的数据信息,通过一般的扫描仪扫描出来的图像文件,激光防伪阴影网格线及各种版面噪声与身份证中的有用信息混合在一起,图像效果很差。
2、打印条件千差万别:身份证上的激光防伪标志和打印数据千差万别,字体多种多样,致使识别信息极不稳定;
3、汉字非常多:身份证上出现汉字很多,属于多字体大字符集识别,且图像质量也有偏差,对识别效果有一定影响。