iOS身份證號碼識別

最近不少簡友說git上下載下來的代碼報(bào)各種問題,因?yàn)榘膸於急容^大,所以大家在pod的時(shí)候耐心等待,另外我已經(jīng)將代碼適配到了iOS10。

一、前言

身份證識別,又稱OCR技術(shù)。OCR技術(shù)是光學(xué)字符識別的縮寫,是通過掃描等光學(xué)輸入方式將各種票據(jù)、報(bào)刊、書籍、文稿及其它印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。

因?yàn)轫?xiàng)目需要,所以這些天查閱了相關(guān)資料,想在網(wǎng)上看看有沒有大神封裝的現(xiàn)成的demo可以用。但是無果,網(wǎng)上關(guān)于ocr這一塊的資料很少,比較靠譜的都是要收費(fèi)的,而且價(jià)格也不便宜。但是在天朝,收費(fèi)感覺心里不爽,所以就決定自己研究一番。

先上一個(gè)最終實(shí)現(xiàn)的效果(如果mac不是retain屏幕的,分辨率會(huì)有影響,需要在真機(jī)上調(diào)試)

最終實(shí)現(xiàn)的效果.gif

二、需要用到的技術(shù)

搜了很多資料,發(fā)現(xiàn)要進(jìn)行身份證號碼的識別,需要用到以下幾種技術(shù):

  • 圖像處理技術(shù)

包括灰度化處理,二值化,腐蝕,輪廊檢測等等。

  1. 灰度化處理:圖片灰度化處理就是將指定圖片每個(gè)像素點(diǎn)的RGB三個(gè)分量通過一定的算法計(jì)算出該像素點(diǎn)的灰度值,使圖像只含亮度而不含色彩信息。
    灰度圖.png
  2. 二值化:二值化處理就是將經(jīng)過灰度化處理的圖片轉(zhuǎn)換為只包含黑色和白色兩種顏色的圖像,他們之間沒有其他灰度的變化。在二值圖中用255便是白色,0表示黑色。
    二值圖.png
  3. 腐蝕:圖片的腐蝕就是將得到的二值圖中的黑色塊進(jìn)行放大。即連接圖片中相鄰黑色像素點(diǎn)的元素。通過腐蝕可以把身份證上的身份證號碼連接在一起形成一個(gè)矩形區(qū)域。
    腐蝕圖.png
  4. 輪廊檢測:圖片經(jīng)過腐蝕操作后相鄰點(diǎn)會(huì)連接在一起形成一個(gè)大的區(qū)域,這個(gè)時(shí)候通過輪廊檢測就可以把每個(gè)大的區(qū)域找出來,這樣就可以定位到身份證上面號碼的區(qū)域。
    輪廊圖.png
  • 文字識別技術(shù)

通過識別圖像,將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。比如下面這張包含一串?dāng)?shù)字的圖片,通過ocr識別技術(shù)可以將圖片中包含的數(shù)字信息以字符串的方式輸出。

包含數(shù)字的圖片.png

三、開源框架OpenCV和TesseractOCRiOS

  • OpenCV(完成圖像處理技術(shù))

OpenCV是一個(gè)開源的跨平臺計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)庫,通俗點(diǎn)的說,就是他給計(jì)算機(jī)提供了一雙眼睛,一雙可以從圖片中獲取信息的眼鏡,從而完成人臉識別、身份證識別、去紅眼、追蹤移動(dòng)物體等等的圖像相關(guān)的功能。opencv官網(wǎng)

  • TesseractOCRiOS(完成文字識別技術(shù))

Tesseract是目前可用的最準(zhǔn)確的開源OCR引擎,可以讀取各種格式的圖片并將他們轉(zhuǎn)換成各種語言文本。而TesseractOCRiOS則是針對iOS平臺封裝的Tesseract引擎庫。

四、實(shí)戰(zhàn)演示

  • 創(chuàng)建一個(gè)iOS項(xiàng)目
  • 用CocoPods導(dǎo)入上面兩個(gè)庫

由于OpenCV庫文件比較大,所以時(shí)間會(huì)稍微久一點(diǎn),耐心等待就是。

podfile文件.png
  • 導(dǎo)入完成之后運(yùn)行項(xiàng)目,會(huì)發(fā)現(xiàn)報(bào)如下錯(cuò)誤
Bitode報(bào)錯(cuò).png

由于導(dǎo)入的庫不支持Bitcode機(jī)制,需要關(guān)掉,在工程->TARGETS->Build Setting-> Enable Bitcode設(shè)置為NO就ok。

關(guān)掉Bitcode.png
  • 導(dǎo)入TesseractOCRiOS需要的語言包

TesseractOCRiOS庫中沒有自帶的語言包,需要我們自己手動(dòng)導(dǎo)入,我們這里直接到tesseract-ocr網(wǎng)站,tessdata即是我們需要用到的語言包。下載下來的語言包有400多兆。這里我們只需要用到英語語言包,所以就只導(dǎo)入eng.traineddata就ok,其他的都刪掉。

導(dǎo)入語言包種需要注意幾點(diǎn):

  1. 語言包需要放在tessdata目錄下。TesseractOCRiOS中查找語言包是在tessdata目錄下進(jìn)行查找的,所以我們不能單獨(dú)把eng.traineddata導(dǎo)入項(xiàng)目中,而需要放在tessdata目錄下導(dǎo)入項(xiàng)目中。
  2. 將tessdata導(dǎo)入xcode項(xiàng)目,需要勾選Create folder refrences。上面已經(jīng)提到了語言包需要放在tessdata目錄下,所以導(dǎo)入文件到xcode的時(shí)候需要?jiǎng)?chuàng)建文件夾的形式,而不是創(chuàng)建組的形式。如下圖:
導(dǎo)入tessdata文件夾的方式.png
  • 創(chuàng)建一個(gè)RecogizeCardManager用來管理身份證識別相關(guān)的代碼。

由于OpenCV和TesseractOCRiOS庫都是基于c++編寫的,所以需要把RecogizeCardManager.m后綴的.m改成.mm

RecogizeCardManager.png
  • RecogizeCardManager中的代碼
.h文件
#import <Foundation/Foundation.h>
@class UIImage;

typedef void (^CompleateBlock)(NSString *text);

@interface RecogizeCardManager : NSObject
  
/**
*  初始化一個(gè)單例
*
*  @return 返回一個(gè)RecogizeCardManager的實(shí)例對象
*/
+ (instancetype)recognizeCardManager;

/**
*  根據(jù)身份證照片得到身份證號碼
*
*  @param cardImage 傳入的身份證照片
*  @param compleate 識別完成后的回調(diào)
*/
- (void)recognizeCardWithImage:(UIImage *)cardImage compleate:(CompleateBlock)compleate;

@end 
.m文件
#import "RecogizeCardManager.h"
#import <opencv2/opencv.hpp>
#import <opencv2/imgproc/types_c.h>
#import <opencv2/imgcodecs/ios.h>
#import <TesseractOCR/TesseractOCR.h>

@implementation RecogizeCardManager

+ (instancetype)recognizeCardManager {
    static RecogizeCardManager *recognizeCardManager = nil;
    static dispatch_once_t onceToken;
    dispatch_once(&onceToken, ^{
        recognizeCardManager = [[RecogizeCardManager alloc] init];
    });
    return recognizeCardManager;
}

- (void)recognizeCardWithImage:(UIImage *)cardImage compleate:(CompleateBlock)compleate {
    //掃描身份證圖片,并進(jìn)行預(yù)處理,定位號碼區(qū)域圖片并返回
    UIImage *numberImage = [self opencvScanCard:cardImage];
    if (numberImage == nil) {
        compleate(nil);
    }
    //利用TesseractOCR識別文字
    [self tesseractRecognizeImage:numberImage compleate:^(NSString *numbaerText) {
        compleate(numbaerText);
    }];
}

//掃描身份證圖片,并進(jìn)行預(yù)處理,定位號碼區(qū)域圖片并返回
- (UIImage *)opencvScanCard:(UIImage *)image {
    
    //將UIImage轉(zhuǎn)換成Mat
    cv::Mat resultImage;
    UIImageToMat(image, resultImage);
    //轉(zhuǎn)為灰度圖
    cvtColor(resultImage, resultImage, cv::COLOR_BGR2GRAY);
    //利用閾值二值化 
    cv::threshold(resultImage, resultImage, 100, 255, CV_THRESH_BINARY);
    //腐蝕,填充(腐蝕是讓黑色點(diǎn)變大)
    cv::Mat erodeElement = getStructuringElement(cv::MORPH_RECT, cv::Size(26,26));
    cv::erode(resultImage, resultImage, erodeElement);
    //輪廊檢測 
    std::vector<std::vector<cv::Point>> contours;//定義一個(gè)容器來存儲所有檢測到的輪廊
    cv::findContours(resultImage, contours, CV_RETR_TREE, CV_CHAIN_APPROX_SIMPLE, cvPoint(0, 0));
    //取出身份證號碼區(qū)域
    std::vector<cv::Rect> rects;
    cv::Rect numberRect = cv::Rect(0,0,0,0);
    std::vector<std::vector<cv::Point>>::const_iterator itContours = contours.begin();
    for ( ; itContours != contours.end(); ++itContours) {
        cv::Rect rect = cv::boundingRect(*itContours);
        rects.push_back(rect);
        //算法原理
        if (rect.width > numberRect.width && rect.width > rect.height * 5) {
            numberRect = rect;
        }
    }    
    //身份證號碼定位失敗
    if (numberRect.width == 0 || numberRect.height == 0) {
        return nil;
    }
    //定位成功成功,去原圖截取身份證號碼區(qū)域,并轉(zhuǎn)換成灰度圖、進(jìn)行二值化處理
    cv::Mat matImage;
    UIImageToMat(image, matImage);
    resultImage = matImage(numberRect);
    cvtColor(resultImage, resultImage, cv::COLOR_BGR2GRAY);
    cv::threshold(resultImage, resultImage, 80, 255, CV_THRESH_BINARY);
    //將Mat轉(zhuǎn)換成UIImage
    UIImage *numberImage = MatToUIImage(resultImage);
    return numberImage;
}

//利用TesseractOCR識別文字
- (void)tesseractRecognizeImage:(UIImage *)image compleate:(CompleateBlock)compleate {
    
    dispatch_async(dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_BACKGROUND, 0), ^{
        G8Tesseract *tesseract = [[G8Tesseract alloc] initWithLanguage:@"eng"];
        tesseract.image = [image g8_blackAndWhite];
        tesseract.image = image;
        // Start the recognition
        [tesseract recognize];
        //執(zhí)行回調(diào)
        compleate(tesseract.recognizedText);
    });
}
  • RecognizeCardViewController代碼
故事版布局界面
故事版布局界面.png
.m文件
#import "RecognizeCardViewController.h"
#import "RecogizeCardManager.h"

@interface RecognizeCardViewController ()<UINavigationControllerDelegate, UIImagePickerControllerDelegate>{
    UIImagePickerController *imgagePickController;
}

@property (weak, nonatomic) IBOutlet UIImageView *imgView;
@property (weak, nonatomic) IBOutlet UILabel *textLabel;
- (IBAction)cameraAction:(id)sender;
- (IBAction)photoAction:(id)sender;

@end

@implementation RecognizeCardViewController

- (void)viewDidLoad {
    [super viewDidLoad];
    
    self.imgView.contentMode = UIViewContentModeScaleAspectFit;
    
    imgagePickController = [[UIImagePickerController alloc] init];
    imgagePickController.delegate = self;
    imgagePickController.modalTransitionStyle = UIModalTransitionStyleFlipHorizontal;
    imgagePickController.allowsEditing = YES;
}

- (void)didReceiveMemoryWarning {
    [super didReceiveMemoryWarning];
    // Dispose of any resources that can be recreated.
}

//拍照
- (IBAction)cameraAction:(id)sender {
    
    //判斷是否可以打開照相機(jī)
    if ([UIImagePickerController isSourceTypeAvailable:UIImagePickerControllerSourceTypeCamera]) {
        imgagePickController.sourceType = UIImagePickerControllerSourceTypeCamera;
        //設(shè)置攝像頭模式(拍照,錄制視頻)為拍照
        imgagePickController.cameraCaptureMode = UIImagePickerControllerCameraCaptureModePhoto;
        [self presentViewController:imgagePickController animated:YES completion:nil];
    } else {
        UIAlertView *alert = [[UIAlertView alloc] initWithTitle:@"提示" message:@"設(shè)備不能打開相機(jī)" delegate:self cancelButtonTitle:@"知道了" otherButtonTitles: nil];
        [alert show];
    }
}

//相冊
- (IBAction)photoAction:(id)sender {
    imgagePickController.sourceType = UIImagePickerControllerSourceTypePhotoLibrary;
    [self presentViewController:imgagePickController animated:YES completion:nil];
}

#pragma mark - UIImagePickerControllerDelegate
//適用獲取所有媒體資源,只需判斷資源類型
- (void)imagePickerController:(UIImagePickerController *)picker didFinishPickingMediaWithInfo:(NSDictionary<NSString *,id> *)info{
    NSString *mediaType=[info objectForKey:UIImagePickerControllerMediaType];
    UIImage *srcImage = nil;
    //判斷資源類型
    if ([mediaType isEqualToString:@"public.image"]){
        srcImage = info[UIImagePickerControllerEditedImage];
        self.imgView.image = srcImage;
        //識別身份證
        self.textLabel.text = @"圖片插入成功,正在識別中...";
        [[RecogizeCardManager recognizeCardManager] recognizeCardWithImage:srcImage compleate:^(NSString *text) {
            if (text != nil) {
                self.textLabel.text = [NSString stringWithFormat:@"識別結(jié)果:%@",text];
            }else {
                self.textLabel.text = @"請選擇照片";
                UIAlertView *alert = [[UIAlertView alloc] initWithTitle:@"提示" message:@"照片識別失敗,請選擇清晰、沒有復(fù)雜背景的身份證照片重試!" delegate:self cancelButtonTitle:@"知道了" otherButtonTitles: nil];
                [alert show];
            }
        }];
    }
    [self dismissViewControllerAnimated:YES completion:nil];
}

//進(jìn)入拍攝頁面點(diǎn)擊取消按鈕
- (void)imagePickerControllerDidCancel:(UIImagePickerController *)picker {
    [self dismissViewControllerAnimated:YES completion:nil];
}

@end

總結(jié)

通過上面的實(shí)驗(yàn),該程序?qū)ι矸葑C識別的正確率幾乎可以達(dá)到90%,剩下的10%主要取決于圖像的預(yù)處理,預(yù)處理程序是整個(gè)識別系統(tǒng)的關(guān)鍵所在。該系統(tǒng)的原理同樣也適用于獲取身份證上其他的信息,也可以應(yīng)用于銀行卡、車牌號等的識別。最后針對實(shí)現(xiàn)的效果進(jìn)行一步總結(jié)。

  • 識別的正確率

主要取決于腐蝕、取出身份證號碼區(qū)域(輪廊提取)的算法這幾個(gè)關(guān)鍵點(diǎn)。

  1. 腐蝕: 腐蝕的參數(shù)很重要,關(guān)于腐蝕的一些介紹,可以參考這篇文章 腐蝕與膨脹(Eroding and Dilating)
  2. 取出身份證號碼區(qū)域的算法(輪廊提取): 所有的處理都是為了在圖片中定位到身份證號碼的區(qū)域,輪廊提取就是這樣一個(gè)操作。篩選輪廊圖的算法很重要但是也是個(gè)難點(diǎn)。我從這篇博客iOS身份證號碼識別中找到了思路。要提取身份證號碼區(qū)域的輪廊,算法的原理就是該輪廊的寬度是所有中最寬的,且寬度的長度必須大于高度的5倍。
    不過這個(gè)算法還是存在不少問題。有的時(shí)候可能圖片背景比較復(fù)雜會(huì)影響到輪廊的檢測,基于這個(gè)問題:
  • 一方面可以通過對圖片的預(yù)處理來進(jìn)行優(yōu)化,減少對檢測身份證號碼區(qū)域的干擾
  • 第二個(gè)方面就是優(yōu)化算法。
  • 識別速度

使用TesseractOCRiOS對比較清晰的文字進(jìn)行識別速度是比較快的,我試過用一張未經(jīng)處理的寫著數(shù)字的圖片來處理,識別速度小于5s。但經(jīng)過二值圖處理之后識別的速度就降低了,我認(rèn)為可以對二值化處理后的圖片進(jìn)一步處理,比如對二值圖進(jìn)行細(xì)化描出骨架,然后在對骨架做均勻的膨脹處理,這樣得到的身份證號碼可能會(huì)清晰很多。

這里貼上幾個(gè)關(guān)于OpenCV的學(xué)習(xí)網(wǎng)站
OpenCV官方學(xué)習(xí)文檔
OpenCV入門指南
OPEN CV for iOS

該項(xiàng)目已經(jīng)開源在github RecognizeCard 上了,如果喜歡可以點(diǎn)個(gè)贊。有什么問題可以留言,我也是第一次接觸,一起進(jìn)步,大家加油。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 轉(zhuǎn)自:http://m.itdecent.cn/p/ac4c4536ca3e# 一、前言??身份證識別,又稱O...
    ZhangCc_閱讀 1,627評論 1 11
  • 身份證識別,又稱OCR技術(shù)。OCR技術(shù)是光學(xué)字符識別的縮寫,是通過掃描等光學(xué)輸入方式將各種票據(jù)、報(bào)刊、書籍、文稿及...
    SunshineAutumn閱讀 6,591評論 12 16
  • 感謝 http://m.itdecent.cn/p/ac4c4536ca3e 很早就想做的一個(gè)demo 寫在前...
    NateLam閱讀 1,669評論 1 6
  • 最近,公司的項(xiàng)目中用到了圖像識別技術(shù),通過拍照來識別身份證號,之前沒有做過,經(jīng)過一番的研究,總算是搞定了,下面就將...
    沐澤sunshine閱讀 9,105評論 1 27
  • 這段時(shí)間項(xiàng)目的需求,需要在注冊的時(shí)候進(jìn)行身份證識別。就簡單的搞了一下。 身份證識別 項(xiàng)目的需求是通過攝像頭的采集獲...
    請輸入賬號名閱讀 8,200評論 12 24

友情鏈接更多精彩內(nèi)容