利用python+opencv获取你的身份证信息 _python

这边小编提前去百度找了几张别人ps过的身份证照片，但是可以用的，我接下来会通过这个身份证照片查询到身份证号码（字体的格式为`OCR-B 10 BT`格式）小编在这里提醒各位不要把一些隐私的东西发到网上，以免被一些图谋不轨的人利用你的这些隐私信息做一些违法犯罪的事情，小编在这里就找了三张图片如下：

文章插图

文章插图

接下来就是实现这个功能的流程图：

文章插图

流程图介绍：【利用python+opencv获取你的身份证信息】前期处理的部分不在描述，流程图和代码注释中都有。其实整个过程并不是很复杂，本来想过在数字识别方面用现成的一些方法，或者想要尝试用到卷积神经网络（CNN）然后做训练集来识别。后来在和朋友交流的时候，朋友给出建议可以尝试使用特征点匹配或者其他类方法。根据最后数字分割出来单独显示的效果，想到了一个适合于我代码情况的简单方法。
建立一个标准号码库（利用上面自制模板数字分割后获得），然后用每一个号码图片与库中所有标准号码图片做相似度匹配，和哪一个模板相似度最高，则说明该图片为哪一位号码。在将模板号码分割成功后，最关键的一步就是进行相似度匹配。为提高匹配的精确度和效率，首先利用cv.resize()将前面被提取出的每位身份证号码以及标准号码库中的号码做图像大小调整，统一将图像均调整为12x18像素的大小，图像大小的选择是经过慎重的考虑的，如果太大则计算过程耗时，如果过小则可能存在较大误差。匹配的具体方案为：记录需要识别的图片与每个模板图片中有多少位置的像素点相同，相同的越多，说明相似度越高，也就最有可能是某个号码。最终将18位号码都识别完成后，得到的具体的相似度矩阵。
具体的代码如下：
#首先导入所需要的库import cv2 as cvimport numpy as npimport matplotlib.pyplot as plt

# 将身份证号码区域从身份证中提取出def Extract(op_image, sh_image):binary, contours, hierarchy = cv.findContours(op_image,cv.RETR_TREE, cv.CHAIN_AppROX_SIMPLE)contours.remove(contours[0])max_x, max_y, max_w, max_h = cv.boundingRect(contours[0])color = (0, 0, 0)for c in contours:x, y, w, h = cv.boundingRect(c)cv.rectangle(op_image, (x, y), (x + w, y + h), color, 1)cv.rectangle(sh_image, (x, y), (x + w, y + h), color, 1)if max_w < w:max_x = xmax_y = ymax_w = wmax_h = hcut_img = sh_image[max_y:max_y+max_h, max_x:max_x+max_w]cv.imshow("The recognized enlarged image", op_image)cv.waitKey(0)cv.imshow("The recognized binary image", sh_image)cv.waitKey(0)return cut_img# 号码内部区域填充(未继续是用此方法)def Area_filling(image, kernel):# The boundary imageiterate = np.zeros(image.shape, np.uint8)iterate[:, 0] = image[:, 0]iterate[:, -1] = image[:, -1]iterate[0, :] = image[0, :]iterate[-1, :] = image[-1, :]while True:old_iterate = iterateiterate_dilation = cv.dilate(iterate, kernel, iterations=1)iterate = cv.bitwise_and(iterate_dilation, image)difference = cv.subtract(iterate, old_iterate)# if difference is all zeros it will return Falseif not np.any(difference):breakreturn iterate# 将身份证号码区域再次切割使得一张图片一位号码def Segmentation(cut_img, kernel, n):#首先进行一次号码内空白填充(效果不佳，放弃)#area_img = Area_filling(cut_img, kernel)#cv.imshow("area_img", area_img)#cv.waitKey(0)#dilate = cv.dilate(area_img, kernel, iterations=1)#cv.imshow("dilate", dilate)#cv.waitKey(0)?cut_copy = cut_img.copy()binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)contours.remove(contours[0])for c in contours:x, y, w, h = cv.boundingRect(c)for i in range(h):for j in range(w):# 把首次用findContours()方法识别的轮廓内区域置黑色cut_copy[y + i, x + j] = 0# cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)cv.imshow("Filled image", cut_copy)cv.waitKey(0)?# 尝试进行分割binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)#tmp_img = cut_img.copy()# 如果识别的轮廓数量不是n+1位(首先是一个整个区域的轮廓，然后是n位号码各自的轮廓，身份证和匹配模板分割均用此方法)while len(contours)!=n+1:if len(contours) < n+1:# 如果提取的轮廓数量小于n+1, 说明可能有两位数被识别到一个轮廓中，做一次闭运算，消除数位之间可能存在的连接部分，然后再次尝试提取#cut_copy = cv.dilate(cut_copy, kernel, iterations=1)cut_copy = cv.morphologyEx(cut_copy, cv.MORPH_CLOSE, kernel)cv.imshow("cut_copy", cut_copy)cv.waitKey(0)# 再次尝试提取身份证区域的轮廓并将轮廓内区域用黑色覆盖binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)# 去掉提取出的第一个轮廓(第一个轮廓为整张图片)contours.remove(contours[0])for c in contours:x, y, w, h = cv.boundingRect(c)for i in range(h):for j in range(w):cut_copy[y + i, x + j] = 0# cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)cv.imshow("Filled image", cut_copy)cv.waitKey(0)#如果findContours()结果为n，跳出if len(contours) == n:break?elif len(contours) > n+1:# 如果提取的轮廓数量大于n+1, 说明可能有一位数被识别到两个轮廓中，做一次开运算，增强附近身份证区域部分之间的连接部分，然后再次尝试提取#cut_copy = cv.erode(cut_copy, kernel, iterations=1)cut_copy = cv.morphologyEx(cut_copy, cv.MORPH_OPEN, kernel2)cv.imshow("cut_copy", cut_copy)cv.waitKey(0)#再次尝试提取身份证区域的轮廓并将轮廓内区域用黑色覆盖binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)#去掉提取出的第一个轮廓(第一个轮廓为整张图片)contours.remove(contours[0])for c in contours:x, y, w, h = cv.boundingRect(c)for i in range(h):for j in range(w):cut_copy[y + i, x + j] = 0# cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)#cv.imshow("cut_copy", cut_copy)#cv.waitKey(0)if len(contours) == n:break# 上述while()中循环完成后，处理的图像基本满足分割要求，进行最后的提取分割binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)contours.remove(contours[0])color = (0, 0, 0)for c in contours:x, y, w, h = cv.boundingRect(c)for i in range(h):for j in range(w):cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)cv.rectangle(cut_img, (x, y), (x + w, y + h), color, 1)?cv.imshow("Filled image", cut_copy)cv.waitKey(0)cv.imshow("cut_img", cut_img)cv.waitKey(0)#print('number:', len(contours))# Returns the result of the splitreturn contours#return cut_img?# Sort排序方法，先将图像分割，由于分割的先后顺序不是按照从左往右，根据横坐标大小将每位身份证号码图片进行排序def sort(contours, image):tmp_num = []x_all = []x_sort = []for c in contours:x, y, w, h = cv.boundingRect(c)# 使用x坐标来确定身份证号码图片的顺序，把个图片坐标的x值放入x_sort中x_sort.append(x)# 建立一个用于索引x坐标的列表x_all.append(x)tmp_img = image[y+1:y+h-1, x+1:x+w-1]tmp_img = cv.resize(tmp_img, (40, 60))cv.imshow("Number", tmp_img)cv.waitKey(0)# 将分割的图片缩小至12乘18像素的大小，标准化同时节约模板匹配的时间tmp_img = cv.resize(tmp_img, (12, 18))tmp_num.append(tmp_img)# 利用x_sort排序，用x_all索引，对身份证号码图片排序x_sort.sort()num_img = []for x in x_sort:index = x_all.index(x)num_img.append(tmp_num[index])# 返回排序后图片列表return num_img?# 图像识别方法def MatchImage(img_num, tplt_num):# IDnum用于存储最终的身份证字符串IDnum = ''# 身份证号码18位for i in range(18):# 存储最大相似度模板的索引以及最大相似度max_index = 0max_simil = 0# 模板有1~9，0，X共11个for j in range(11):# 存储身份证号码图片与模板之间的相似度simil = 0for y in range(18):for x in range(12):# 如果身份证号码图片与模板之间对应位置像素点相同，simil 值自加1if img_num[i][y,x] == tplt_num[j][y,x]:simil+=1if max_simil < simil:max_index = jmax_simil = similprint(str(simil)+' ',end='')if max_index < 9:IDnum += str(max_index+1)elif max_index == 9:IDnum += str(0)else:IDnum += 'X'print()return IDnum?# 最终效果展示def display(IDnum, image):image = cv.resize(image, (960, 90))plt.figure(num='ID_Number')plt.subplot(111), plt.imshow(image, cmap='gray'), plt.title(IDnum, fontsize=30), plt.xticks([]), plt.yticks([])plt.show()??if __name__ == '__main__':# 一共三张做测试用身份证图像path = 'IDcard01.jpg'#path = 'IDcard02.png'#path = 'IDcard.jpg'id_card = cv.imread(path, 0)cv.imshow('Original image', id_card)cv.waitKey(0)# 将图像转化成标准大小id_card = cv.resize(id_card,(1200, 820))cv.imshow('Enlarged original image', id_card)cv.waitKey(0)# 图像二值化ret, binary_img = cv.threshold(id_card, 127, 255, cv.THRESH_BINARY)cv.imshow('Binary image', binary_img)cv.waitKey(0)?# RECTANGULARkernel = cv.getStructuringElement(cv.MORPH_RECT, (3, 3))# RECTANGULARkernel2 = cv.getStructuringElement(cv.MORPH_DILATE, (5, 5))#close_img = cv.morphologyEx(binary_img, cv.MORPH_CLOSE, kernel)# The corrosion treatment connects the ID Numberserode = cv.erode(binary_img, kernel, iterations=10)cv.imshow('Eroded image', erode)cv.waitKey(0)?cut_img = Extract(erode, binary_img.copy())cv.imshow("cut_img", cut_img)cv.waitKey(0)?# 存储最终分割的轮廓contours = Segmentation(cut_img, kernel, 18)# 对图像进行分割并排序img_num = sort(contours, cut_img)?# 识别用的模板tplt_path = '/home/image/Pictures/template.jpg'tplt_img = cv.imread(tplt_path, 0)#cv.imshow('Template image', tplt_img)#cv.waitKey(0)?ret, binary_tplt = cv.threshold(tplt_img, 127, 255, cv.THRESH_BINARY)cv.imshow('Binary template image', binary_tplt)cv.waitKey(0)?# 与身份证相同的分割方式contours = Segmentation(binary_tplt, kernel, 11)tplt_num = sort(contours, binary_tplt)# 最终识别出的身份证号码IDnum = MatchImage(img_num, tplt_num)print('nID_Number is:', IDnum)# 图片展示display(IDnum, cut_img)
上一页
1
2
下一页
		  	






























推荐阅读

           
                  
              
                  【隐秘的角落】豆瓣9.0！解析《隐秘的角落》五个隐藏亮点，12集真的不够看 
                
                   
                
              
            

                  
              
                  时尚乐趣社|英58岁亿万富豪公开招女友，身体硬朗爱穿Polo衫，禁止女友怀孕？ 
                
                   
                
              
            

                  
              
                  我向优客逸家索要租房发票，他们让我再交3%的税点钱，优客逸家算是偷税漏税吗 
                
                   
                
              
            

                  
              
                  匈奴族的历史演变,匈奴发展简史- 
                
                   
                
              
            

                  
              
                  用去角质前用洗面奶吗 
                
                   
                
              
            

                  
              
                  高山春茶是红茶吗,峨眉山金峨红茶 
                
                   
                
              
            

                  
              
                  护肤品|你的护肤真的是有效护肤吗？ 
                
                   
                
              
            

                  
              
                  「售价」售价16.99-23.99万元 雪佛兰新探界者正式上市 
                
                   
                
              
            

                  
              
                  武汉将以区为单位徵用一批民营医院 对疑似患者实行集中隔离 
                
                   
                
              
            

                  
              
                  狍子说体坛|NBA复赛园区宾馆现针孔摄像头？女主持人在房间被偷录 视频已传上网，原创 
                
                   
                
              
            

                  
              
                  洞悉天下@却暴露美国一致命威胁，伊朗悬着的心终于放下，新冠疫情席卷全球 
                
                   
                
              
            

                  
              
                   土司|这座700年古墓里藏有大量黄金，却没有被盗，专家都看傻眼！ 
                
                   
                
              
            

                  
              
                  姜葱鸡的做法 
                
                   
                
              
            

                  
              
                  华为Mate30■5nm工艺芯片+挖孔屏华为Mate40曝光，华为Mate30即将悲惨让路价崩 
                
                   
                
              
            

                  
              
                  珠穆朗玛摄影展近400幅作品展西藏新变化 
                
                   
                
              
            

                  
              
                  杨勇|实录 | 深藏功名的杨树柏：朝鲜战场一个人的阻击战 
                
                   
                
              
            

                  
              
                  『考古秘史』价值更在毛公鼎之上，专家：根本不贵，一只“平底锅”拍出2.1亿 
                
                   
                
              
            

                  
              
                  防辐射窗帘有很多种类，该怎么选？ 
                
                   
                
              
            

                  
              
                  张彬彬|虞书欣携手张彬彬《小森林》热度破万，过去曾因矫情做作被骂爆 
                
                   
                
              
            

                  
              
                  中国经济网|上半年新增城轨运营里程270多公里 
                
                   
                
              
            

          

汽车车道视频检测：python+OpenCV为主实现 

喝茶向吃茶的阶段转变,利用茶和饮茶的三个阶段 

如何获取Linux或者macOS系统版本相关信息 

如何利用Java代码操作索引库？ 

利用 Milvus 搭建基于图的推荐系统 

利用这个 USB ID 仓库识别更多 Linux 上的设备 

路由器怎么自动获取IPv6地址？ 

征途手机版技能点如何获取答题答案 

win7如何获得管理员权限?win7系统怎么获取管理员权限? 

教你利用 PHP 实现微服务