ORC識別身份證遇到的問題--已完成

身份證圖片拍照存在亮度不均的情況,導致過濾出現(xiàn)部分區(qū)域無法識別。

初步解決辦法:

1.切割圖片,按照區(qū)域坐標切割出名字,身份證號兩塊大致區(qū)域。再將身份證號切割成多個小圖片(因為號碼較長,光線不均勻情況很明顯)? ? 前端拍照時通過攝像頭提示框解決切割圖片

2.色彩過濾,忽略RGB值超過300的像素,將其調(diào)整為-1變?yōu)榘咨#?00這個閾值需要根據(jù)實際圖片進行調(diào)整,如果光線過強,則數(shù)值要調(diào)大一些)? ?通過OpenCV進行二值化、去噪點。(如果是進行驗證碼識別,還需要RGB分層等算法進行過濾雜質(zhì),比較復雜后續(xù)有時間會研究)

3.圖片拼接,將多段身份證號碼的小圖片重新拼接然后進行OCR識別。? 經(jīng)過上面兩步之后已經(jīng)解決問題

繼續(xù)。

切割圖片直接用java自帶的包根據(jù)坐標來解決,拍照傾斜角造成了圖片曝光不均的問題嚴重影響解析,找了下資料準備使用opencv提供的局部自適應閾值圖像二值化來試試。web下使用opencv出現(xiàn)Exception in thread "main" java.lang.UnsatisfiedLinkError: no opencv_java249 in java.library.path,而且服務器是在linux上,先去服務器安裝opencv。

2017.9.1日繼續(xù)

身份證識別功能基本完成。

使用opencv對圖片進行二值化(可以去除光線造成的曝光不均問題)、去噪點(忽略小區(qū)域像素,這點非常重要。我使用了點手段,通過縮放和擴大來,試了下縮2擴2連續(xù)3-4次效果比較好)

tess4j進行文本識別。直接上maven

正則過濾保留數(shù)字、中文、字母。

.String reg = "[^a-zA-Z0-9\\u4e00-\\u9fa5]";

result = result.replaceAll(reg, "");

身份證號驗證規(guī)則驗證號碼正確性。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • 身份證識別,又稱OCR技術。OCR技術是光學字符識別的縮寫,是通過掃描等光學輸入方式將各種票據(jù)、報刊、書籍、文稿及...
    SunshineAutumn閱讀 6,591評論 12 16
  • 轉(zhuǎn)自:http://m.itdecent.cn/p/ac4c4536ca3e# 一、前言??身份證識別,又稱O...
    ZhangCc_閱讀 1,627評論 1 11
  • 最近不少簡友說git上下載下來的代碼報各種問題,因為包含的庫都比較大,所以大家在pod的時候耐心等待,另外我已經(jīng)將...
    peaktan閱讀 38,488評論 158 327
  • 這段時間項目的需求,需要在注冊的時候進行身份證識別。就簡單的搞了一下。 身份證識別 項目的需求是通過攝像頭的采集獲...
    請輸入賬號名閱讀 8,200評論 12 24
  • 聲明 本文暫時禁止任何形式的轉(zhuǎn)載, 以下示例圖片為了不侵犯個人行駛證隱私,全部做打碼處理。 感想 做了近一個月的圖...
    熱血沸騰閱讀 9,962評論 3 14

友情鏈接更多精彩內(nèi)容