最近在研究如何把黏在一起的字給分開,好往下一步 餵給機(jī)器來讓他識(shí)別!!(自己不大算講太深,我只想寫個(gè)心得,我從無概念,到現(xiàn)在搞了快一週了,難度頗高!!? ?原因這個(gè)論文數(shù)學(xué)式?jīng)]導(dǎo)清楚,會(huì)用,但有些不知道原因,導(dǎo)致弄了很久找問題,而且也不適合完全所有黏字的圖片)
我一開始以為很簡(jiǎn)單,想說套個(gè)API馬上就好,沒想到實(shí)非易事。中間卡關(guān)時(shí),因?yàn)楹芏鄷r(shí)候碰到的黏字非常歪斜,躁點(diǎn)多,導(dǎo)至compiler 編譯時(shí),識(shí)別不出來。像這種圖靈識(shí)別的圖,人可以看的出來,但要給機(jī)器看,有一點(diǎn)難度。

我就自己摸了索了,拜讀了G. Congedo, G. Dimauro, S. Impedovo, G. Pirlo寫的Segmentation of Numeric Strings這篇論文,花了三到四天,讀熟他時(shí),開始實(shí)作這種滴水分割法,對(duì)這種黏在一起的字,來切再適合也不過了
試著用code 來仿他的論文中的數(shù)學(xué)式
他這難點(diǎn)在水滴降落點(diǎn)在x軸線上的哪一部分,我上網(wǎng)看其他人都是把它投影到x軸上,取其長(zhǎng)度的中位數(shù)在減4
+在加後面的值(看那幾乎等於零a.index(min(b),心想那這寫有啥屁用!! 論文上也沒交待清楚,他們因該有些例外,覺得不合理,自己try很多次改良了他的參數(shù)值
雖然樣子不是很好看,但測(cè)試的資料網(wǎng)上都有,可以把字餵給機(jī)器教他辨識(shí)字母了!!