人臉識(shí)別長(zhǎng)篇研究2

五、人臉識(shí)別(FR)的產(chǎn)品落地

1、FR技術(shù)產(chǎn)品的優(yōu)勢(shì)

1)非接觸:

人臉圖像的采集不同于指紋、掌紋需要接觸指掌紋專用采集設(shè)備,指掌紋的采集除了對(duì)設(shè)備有一定的磨損外,也不衛(wèi)生,容易引起被采集者的反感,而人臉圖像采集的設(shè)備是攝像頭,無(wú)須接觸。

  2)非侵?jǐn)_:

人臉照片的采集可使用攝像頭自動(dòng)拍照,無(wú)須工作人員干預(yù),也無(wú)須被采集者配合,只需以正常狀態(tài)經(jīng)過(guò)攝像頭前即可。

  3)友好:

人臉是一個(gè)人出生之后暴露在外的生物特征,因此它的隱私性并不像指掌紋、虹膜那樣強(qiáng),因此人臉的采集并不像指掌紋采集那樣難以讓人接受。

  4)直觀:

我們判斷一個(gè)人是誰(shuí),通過(guò)看這個(gè)人的臉就是最直觀的方式,不像指掌紋、虹膜等需要相關(guān)領(lǐng)域?qū)<也趴梢耘袆e。

  5)快速:

從攝像頭監(jiān)控區(qū)域進(jìn)行人臉的采集是非??焖俚模?yàn)樗姆歉深A(yù)性和非接觸性,讓人臉采集的時(shí)間大大縮短。

  6)簡(jiǎn)便:

人臉采集前端設(shè)備——攝像頭隨處可見,它不是專用設(shè)備,因此簡(jiǎn)單易操作。

  7)可擴(kuò)展性好:

它的采集端完全可以采用現(xiàn)有視頻監(jiān)控系統(tǒng)的攝像設(shè)備,后端應(yīng)用的擴(kuò)展性決定了人臉識(shí)別可以應(yīng)用在出入控制、黑名單監(jiān)控、人臉照片搜索等多領(lǐng)域。

?

2、FR三大識(shí)別場(chǎng)景

1)人臉確認(rèn)(1:1):

(1)簡(jiǎn)介:

將某人面像與指定人員面像進(jìn)行一對(duì)一的比對(duì),根據(jù)其相似程度來(lái)判斷二者是否是同一人,相似 程度一般以能否超過(guò)某一量化閥值為依據(jù)。簡(jiǎn)單的說(shuō)就是A/B兩張照片比對(duì),產(chǎn)生的計(jì)算數(shù)值是否達(dá)到要求。

(2)產(chǎn)品應(yīng)用:

快速的人臉識(shí)別比對(duì),移動(dòng)支付認(rèn)證、安全性身份核對(duì)、作為身份確認(rèn)的一種新方式,比如考生身份確認(rèn)、公司考勤確認(rèn)、各種證件照和本人確認(rèn)。

(3)實(shí)際問(wèn)題:

產(chǎn)品在系統(tǒng)設(shè)計(jì)的邏輯上,需要先考慮調(diào)取已儲(chǔ)存對(duì)象信息的先驗(yàn)條件。通過(guò)界面/語(yǔ)音的提示,使得待認(rèn)證者預(yù)先知道自己正處于被核對(duì)的過(guò)程中,且已預(yù)先了解擬核對(duì)對(duì)象的身份。

(4)比對(duì)來(lái)源的三種主要方式:

1. 用戶自傳照片,比如支付寶的人臉比對(duì),用戶自傳的照片最大的問(wèn)題是照片質(zhì)量的合格率太低,拍照的光線、角度等因素會(huì)導(dǎo)致采集源的質(zhì)量下降,不利于后期的大批量人臉特征碼管理。

2. 使用身份證讀卡器,讀取身份證上的照片,遺憾的是這張照片2K的大小,不過(guò)也是目前用最多的源照片提取方式,比較適合簽到場(chǎng)合。

3. 使用公安部旗下NCIIC的人臉比對(duì)接口(注意,不是網(wǎng)紋照片接口,這個(gè)接口已經(jīng)不對(duì)外),使用的是直接的人臉比對(duì)接口。

2)人臉辨認(rèn)(1:N):

(1)簡(jiǎn)介:

將某人面像與數(shù)據(jù)庫(kù)中的多人的人臉進(jìn)行比對(duì),并根據(jù)比對(duì)結(jié)果來(lái)鑒定此人身份,或找到其中最相似的人臉,并按相似程度的大小輸出檢索結(jié)果。

(2)產(chǎn)品應(yīng)用:

人臉開門、人臉檢索,排查犯罪嫌疑人、失蹤人口的全庫(kù)搜尋、一人多證的重復(fù)排查等。

(3)實(shí)際問(wèn)題:

1、走失兒童的項(xiàng)目中去: 這一類系統(tǒng)的部署需要兩個(gè)條件:A. BCD基本庫(kù)(比如1000萬(wàn)人) B.強(qiáng)大的算法硬件

2、零售店中的刷臉支付長(zhǎng)江,需要用戶預(yù)先輸入全手機(jī)號(hào),確定用戶身份再進(jìn)行人臉識(shí)別,將原本為1:N的問(wèn)題轉(zhuǎn)化為了1:1的問(wèn)題。

(4)產(chǎn)品難點(diǎn):

1、1:N中的N能夠支持多大

① 場(chǎng)景多樣化

從一個(gè)班級(jí)百號(hào)人刷臉簽到,到一個(gè)公司千號(hào)人的刷臉打卡,再到一個(gè)學(xué)校的幾萬(wàn)人,一個(gè)四線城市幾十 萬(wàn)人,一個(gè)一線城市的幾千萬(wàn)人,難度是呈指數(shù)上升的。

② 公司實(shí)際情況

目前各家公司的成熟人臉識(shí)別應(yīng)用能夠支持幾萬(wàn)到幾百萬(wàn)人不等的應(yīng)用場(chǎng)景,而且還有一個(gè)錯(cuò)誤率的概念。比如,公司宣稱千萬(wàn)分之一的錯(cuò)誤率的情況下(1/10000000),人臉通過(guò)率其實(shí)只有93%,這是因?yàn)楹茈y做到一定不發(fā)生錯(cuò)誤,而且每個(gè)人都能識(shí)別通過(guò)。(假如一家公司說(shuō)自己能做到億分之一的錯(cuò)誤率,通過(guò)率能做到98%以上,多半是虛假宣傳,在實(shí)際使用中是很難達(dá)到的)

2、非配合場(chǎng)景

在配合場(chǎng)景下:比如ATM機(jī)刷臉取款,用戶會(huì)自主配合,將人臉以一個(gè)理想的角度通過(guò)識(shí)別。

而在非配合應(yīng)用場(chǎng)景下,比如監(jiān)控視頻下的人臉識(shí)別,追蹤違法犯罪分子的身份信息,情況就要困難得多。這種情況下,用戶臉部會(huì)發(fā)生角度偏大,遮擋,光線不可控等問(wèn)題。

3、跨人種,跨年齡識(shí)別問(wèn)題

研究發(fā)現(xiàn),在一個(gè)數(shù)據(jù)集上訓(xùn)練好的模型,想到遷移到另外一個(gè)人種上,效果會(huì)出現(xiàn)較大程度的下降。另 外,人臉隨著年齡的變化帶來(lái)的改變也給人臉識(shí)別帶來(lái)不小的挑戰(zhàn)。

要改善這樣的問(wèn)題,一個(gè)必要條件是需要建立一個(gè)足夠完備的跨人種,跨年齡的人臉數(shù)據(jù)庫(kù);在國(guó)內(nèi)的話,是 以漢族人為主,同時(shí)跨年齡的人臉數(shù)據(jù)庫(kù)也比較難收集,需要不短的時(shí)間跨度。

4、產(chǎn)品體驗(yàn)

① 近來(lái)備受關(guān)注的刷臉支付,很多時(shí)候都會(huì)要求用戶輸入全手機(jī)號(hào),或手機(jī)號(hào)后四位,以縮小用戶搜索庫(kù)大 小,實(shí)際上這是比較影響體驗(yàn)的。

② 西安一高校晨讀刷臉簽到,由于系統(tǒng)實(shí)際響應(yīng)匹配時(shí)間過(guò)長(zhǎng),導(dǎo)致學(xué)生排百米長(zhǎng)隊(duì)。

3)多人臉檢索(N:N):

(1)簡(jiǎn)介:

1:N同時(shí)作業(yè)就是N:N了,同時(shí)相應(yīng)多張照片檢索需求。

(2)實(shí)際產(chǎn)品問(wèn)題中:

1、在視頻級(jí)N:N的校驗(yàn)中,如果要提高通過(guò)率,很多時(shí)候是采取降低準(zhǔn)確率的方式,降低算法隊(duì)列數(shù)量;同樣在一些比賽中為了降低誤識(shí)率,大大提高了準(zhǔn)確率,所以算法在校驗(yàn)的過(guò)程中必須遵循至少一個(gè)固定標(biāo)準(zhǔn),追求的是速度效率還是最高準(zhǔn)確率。

2、視頻流的幀處理所用,對(duì)服務(wù)器的計(jì)算環(huán)境要求嚴(yán)苛,目前的算法系統(tǒng)所支撐的輸出率非常有限。

主要的限制如下:

海量的人臉照片解析需要大量運(yùn)算(目前很少看到在采集端直接解析的,都是照片剪裁)海量的人臉照片傳輸需要大量的帶寬(常見的720布控?cái)z像頭抓取最小的人臉照片為20K)海量的人臉照片在后臺(tái)檢索需要耗費(fèi)大量的運(yùn)算(國(guó)內(nèi)主流主機(jī)為例,最多到24路攝像頭

3、產(chǎn)品實(shí)戰(zhàn)中的物理問(wèn)題:

1)光照問(wèn)題

(1)簡(jiǎn)介:

光照問(wèn)題是機(jī)器視覺(jué)重的老問(wèn)題,在人臉識(shí)別中的表現(xiàn)尤為明顯。由于人臉的3D結(jié)構(gòu),光照投射出的陰影,會(huì)加強(qiáng)或減弱原有的人臉特征。

(2)解決思路:

A、對(duì)其進(jìn)行包括光照強(qiáng)度和方向、人臉?lè)瓷鋵傩缘牧炕?,面部陰影和照度分析等,嘗試建立數(shù)學(xué)模型,以利用這些光照模型,在人臉圖像預(yù)處理或者歸一化階段盡可能的補(bǔ)償乃至消除其對(duì)識(shí)別性能的影響,將固有的人臉屬性(反射率屬性、3D表面形狀屬性)和光源、遮擋及高光等非人臉固有屬性分離開來(lái)。

B、基于光照子空間模型的任意光照?qǐng)D像生成算法,用于生成多個(gè)不同光照條件的訓(xùn)練樣本,然后利用具有良好的學(xué)習(xí)能力的人臉識(shí)別算法,如子空間法,SVM等方法進(jìn)行識(shí)別。

2)人臉姿態(tài)問(wèn)題

(1)簡(jiǎn)介:

與光照問(wèn)題類似,姿態(tài)問(wèn)題也是目前人臉識(shí)別研究中需要解決的一個(gè)技術(shù)難點(diǎn)。姿態(tài)問(wèn)題涉及頭部在三維垂直坐標(biāo)系中繞三個(gè)軸的旋轉(zhuǎn)造成的面部變化,其中垂直于圖像平面的兩個(gè)方向的深度旋轉(zhuǎn)會(huì)造成面部信息的部分缺失。針對(duì)姿態(tài)的研究相對(duì)比較的少,目前多數(shù)的人臉識(shí)別算法主要針列正面、準(zhǔn)正而人臉圖像,當(dāng)發(fā)生俯仰或者左右側(cè)而比較厲害的情況下,人臉識(shí)別算法的識(shí)別率也將會(huì)急劇下降。面部幅度較大的哭、笑、憤怒等表情變化同樣影像著面部識(shí)別的準(zhǔn)確率。(2)解決思路:

1、第一種思路:

是學(xué)習(xí)并記憶多種姿態(tài)特征,這對(duì)于多姿態(tài)人臉數(shù)據(jù)可以容易獲取的情況比較實(shí)用,其優(yōu)點(diǎn)是算法與正面人臉識(shí)別統(tǒng)一,不需要額外的技術(shù)支持,其缺點(diǎn)是存儲(chǔ)需求大,姿態(tài)泛化能力不能確定,不能用于基于單張照片的人臉識(shí)別算法中等。

2、第二種思路:

是基于單張視圖生成多角度視圖,可以在只能獲取用戶單張照片的情況下合成該用戶的多個(gè)學(xué)習(xí)樣本,可以解決訓(xùn)練樣本較少的情況下的多姿態(tài)人臉識(shí)別問(wèn)題,從而改善識(shí)別性能。

3、第三種思路:

是基于姿態(tài)不變特征的方法,即尋求那些不隨姿態(tài)的變化而變化的特征。中科院計(jì)算所的思路是采用基于統(tǒng)計(jì)的視覺(jué)模型,將輸入姿態(tài)圖像校正為正面圖像,從而可以在統(tǒng)一的姿態(tài)空間內(nèi)作特征的提取和匹配。

3)遮擋問(wèn)題

對(duì)于非配合情況下的人臉圖像采集,遮擋問(wèn)題是一個(gè)非常嚴(yán)重的問(wèn)題。特別是在監(jiān)控環(huán)境下,往往彼監(jiān)控對(duì)象都會(huì)帶著眼鏡,帽子等飾物,使得被采集出來(lái)的人臉圖像有可能不完整,從而影響了后面的特征提取與識(shí)別,甚至?xí)?dǎo)致人臉檢測(cè)算法的失效。

4)年齡變化

隨著年齡的變化,面部外觀也在變化,特別是對(duì)于青少年,這種變化更加的明顯。對(duì)于不同的年齡段,人臉識(shí)別算法的識(shí)別率也不同。一個(gè)人從少年變成青年,變成老年,他的容貌可能會(huì)發(fā)生比較大的變化,從而導(dǎo)致識(shí)別率的下降。對(duì)于不同的年齡段,人臉識(shí)別算法的識(shí)別率也不同。

5)人臉相似性

不同個(gè)體之間的區(qū)別不大,所有的人臉的結(jié)構(gòu)都相似,甚至人臉器官的結(jié)構(gòu)外形都很相似。這樣的特點(diǎn)對(duì)于利用人臉進(jìn)行定位是有利的,但是對(duì)于利用人臉區(qū)分人類個(gè)體是不利的

6)圖像質(zhì)量

人臉圖像的來(lái)源可能多種多樣,由于采集設(shè)備的不同,得到的人臉圖像質(zhì)量也不一樣,特別是對(duì)于那些低分辨率、噪聲大、質(zhì)量差的人臉圖像(如手機(jī)攝像頭拍攝的人臉圖片、遠(yuǎn)程監(jiān)控拍攝的圖片等)如何進(jìn)行有效地人臉識(shí)別是個(gè)需要關(guān)注的問(wèn)題。同樣的,對(duì)于高分辨圖像對(duì)人臉識(shí)別算法的影響也需要進(jìn)一步的研究。

7)樣本缺乏

基于統(tǒng)計(jì)學(xué)習(xí)的人臉識(shí)別算法是目前人臉識(shí)別領(lǐng)域中的主流算法,但是統(tǒng)計(jì)學(xué)習(xí)方法需要大量的訓(xùn)練。由于人臉圖像在高維空間中的分布是一個(gè)不規(guī)則的流形分布,能得到的樣本只是對(duì)人臉圖像空間中的一個(gè)極小部分的采樣,如何解決小樣本下的統(tǒng)計(jì)學(xué)習(xí)問(wèn)題有待進(jìn)一步的研究。

8)海量數(shù)據(jù)

傳統(tǒng)人臉識(shí)別方法如PCA、LDA等在小規(guī)模數(shù)據(jù)中可以很容易進(jìn)行訓(xùn)練學(xué)習(xí)。但是對(duì)于海量數(shù)據(jù),這些方法其訓(xùn)練過(guò)程難以進(jìn)行,甚至有可能崩潰。

9)大規(guī)模人臉識(shí)別

隨著人臉數(shù)據(jù)庫(kù)規(guī)模的增長(zhǎng),人臉?biāo)惴ǖ男阅軐⒊尸F(xiàn)下降

10)動(dòng)態(tài)識(shí)別

非配合性人臉識(shí)別的情況下,運(yùn)動(dòng)導(dǎo)致面部圖像模糊或攝像頭對(duì)焦不正確都會(huì)嚴(yán)重影響面部識(shí)別的成功率。在地鐵、高速公路卡口、車站卡口、超市反扒、邊檢等安保和監(jiān)控識(shí)別的使用中,這種困難明顯突出;

11)人臉?lè)纻?/p>

偽造人臉圖像進(jìn)行識(shí)別的主流欺騙手段是建立一個(gè)三維模型,或者是一些表情的嫁接。隨著人臉?lè)纻渭夹g(shù)的完善、3D面部識(shí)別技術(shù)、攝像頭等智能計(jì)算視覺(jué)技術(shù)的引入,偽造面部圖像進(jìn)行識(shí)別的成功率會(huì)大大降低。

12)丟幀和丟臉問(wèn)題

需要的網(wǎng)絡(luò)識(shí)別和系統(tǒng)的計(jì)算機(jī)識(shí)別可能會(huì)造成視頻的丟幀和丟臉現(xiàn)象,特別是監(jiān)控人流量大的區(qū)域,由于網(wǎng)絡(luò)傳輸?shù)膸拞?wèn)題和計(jì)算能力問(wèn)題,常常引起丟幀和丟臉問(wèn)題。

13)攝像機(jī)的頭像問(wèn)題

攝像機(jī)很多技術(shù)參數(shù)影響視頻圖像的質(zhì)量,這些因素有感光器(CCD、CMOS)、感光器的大小、DSP的處理速度、內(nèi)置圖像處理芯片和鏡頭等,同時(shí)攝像機(jī)內(nèi)置的一些設(shè)置參數(shù)也將影響質(zhì)量,如曝光時(shí)間、光圈、動(dòng)態(tài)白平衡等參數(shù)。

?

4、實(shí)戰(zhàn)中的數(shù)據(jù)標(biāo)注

1)數(shù)據(jù)標(biāo)注

(1)一般來(lái)說(shuō),數(shù)據(jù)標(biāo)注部分可以有三個(gè)角色

1. 標(biāo)注員:標(biāo)注員負(fù)責(zé)標(biāo)記數(shù)據(jù)。

2. 審核員:審核員負(fù)責(zé)審核被標(biāo)記數(shù)據(jù)的質(zhì)量。

3. 管理員:管理人員、發(fā)放任務(wù)、統(tǒng)計(jì)工資。

只有在數(shù)據(jù)被審核員審核通過(guò)后,這批數(shù)據(jù)才能夠被算法同事利用。

(2)數(shù)據(jù)標(biāo)記流程

1. 任務(wù)分配:假設(shè)標(biāo)注員每次標(biāo)記的數(shù)據(jù)為一次任務(wù),則每次任務(wù)可由管理員分批發(fā)放記錄,也可將整個(gè)流程做成“搶單式”的,由后臺(tái)直接分發(fā)。

2. 標(biāo)記程序設(shè)計(jì):需要考慮到如何提升效率,比如快捷鍵的設(shè)置、邊標(biāo)記及邊存等等功能都有利于提高標(biāo)記效率。

3. 進(jìn)度跟蹤:程序?qū)?biāo)注員、審核員的工作分別進(jìn)行跟蹤,可利用“規(guī)定截止日期”的方式淘汰怠惰的人。

4. 質(zhì)量跟蹤:通過(guò)計(jì)算標(biāo)注人員的標(biāo)注正確率和被審核通過(guò)率,對(duì)人員標(biāo)注質(zhì)量進(jìn)行跟蹤,可利用“末位淘汰”制提高標(biāo)注人員質(zhì)量。

2)模型訓(xùn)練

數(shù)據(jù)標(biāo)記完成后,交由算法同學(xué)進(jìn)行模型的訓(xùn)練,期間發(fā)現(xiàn)的問(wèn)題可與產(chǎn)品一起商討。訓(xùn)練過(guò)程中,最好能可視化一些中間結(jié)果。一來(lái)可以檢測(cè)代碼實(shí)現(xiàn)是否有Bug,二來(lái)也可以通過(guò)這些中間結(jié)果,來(lái)幫助自己更好的理解這個(gè)算法的過(guò)程。

3)模型測(cè)試

測(cè)試同事(一般來(lái)說(shuō)算法同事也會(huì)直接負(fù)責(zé)模型測(cè)試)將未被訓(xùn)練過(guò)的數(shù)據(jù)在新的模型下做測(cè)試。

如果沒(méi)有后臺(tái)設(shè)計(jì),測(cè)試結(jié)果只能由人工抽樣計(jì)算,抽樣計(jì)算繁瑣且效率較低。模型的效果,需要在精確率(識(shí)別為正確的樣本數(shù)/識(shí)別出來(lái)的樣本數(shù))和召回率(識(shí)別為正確的樣本數(shù)/所有樣本中正確的數(shù))中達(dá)到某一個(gè)平衡。

測(cè)試同事需要關(guān)注特定領(lǐng)域內(nèi)每個(gè)類別的指標(biāo),比如針對(duì)識(shí)別人臉的表情,里面有喜怒哀樂(lè)等分類,每一個(gè)分類對(duì)應(yīng)的指標(biāo)都是不一樣的。測(cè)試同事需要將測(cè)試的結(jié)果完善地反饋給算法同事,算法同事才能找準(zhǔn)模型效果欠缺的原因。同時(shí),測(cè)試同事將本次模型的指標(biāo)結(jié)果反饋給產(chǎn)品,由產(chǎn)品評(píng)估是否滿足上線需求。

(1)測(cè)試環(huán)境說(shuō)明

例如:

CPU:Intel(R) Core(TM) i7-4790 CPU @ 3.60 GHz

內(nèi)存:8GB

系統(tǒng):Ubuntu 14.04 x86_64/Windows 7 SP1 64bit

GCC版本:4.8.2

(2)測(cè)試集和測(cè)試需求說(shuō)明(比如“圖片包含人臉大小應(yīng)超過(guò)96*96像素,測(cè)試結(jié)果達(dá)到XX程度滿足需求)

1. 經(jīng)典人臉身份識(shí)別測(cè)試集LFW,共包含13233 張圖片 5749 種不同身份;世界記錄99.7%。

2. CK+ (一個(gè)人臉表情數(shù)據(jù)集),包含固定表情和自發(fā)表情,包含123個(gè)人的593個(gè)表情序列。每個(gè)序列的目標(biāo)表情被FACS編碼,同時(shí)添加了已驗(yàn)證的情感標(biāo)簽(生氣、厭惡、害怕、快樂(lè)、悲傷、驚訝)。

(3)需要說(shuō)明“有效距離,左右角度,上下角度,速度”等參數(shù)值(范圍)

注:這和“部署的靈活性”相關(guān)——由于不同客戶不同場(chǎng)景的需求不同,所以技術(shù)方的人臉檢測(cè)模塊,一般可以通過(guò)調(diào)整參數(shù)得到N種亞型,以適應(yīng)不同應(yīng)用場(chǎng)景(光照、角度、有效距離、速度) 下對(duì)運(yùn)算量和有效檢測(cè)距離的需求。

(4)測(cè)試結(jié)果——欠擬合

1、定義:模型沒(méi)有很好地捕捉到數(shù)據(jù)特征,不能夠很好地?cái)M合數(shù)據(jù)

左圖表示size與prize關(guān)系的數(shù)據(jù),中間的圖就是出現(xiàn)欠擬合的模型,不能夠很好地?cái)M合數(shù)據(jù),如果在中間的圖的模型后面再加一個(gè)二次項(xiàng),就可以很好地?cái)M合圖中的數(shù)據(jù)了,如右面的圖所示。

2、解決方法:

1)添加其他特征項(xiàng),有時(shí)候我們模型出現(xiàn)欠擬合的時(shí)候是因?yàn)樘卣黜?xiàng)不夠?qū)е碌?,可以添加其他特征?xiàng)來(lái)很好地解決。例如,“組合”、“泛化”、“相關(guān)性”三類特征是特征添加的重要手段,無(wú)論在什么場(chǎng)景,都可以照葫蘆畫瓢,總會(huì)得到意想不到的效果。

2)添加多項(xiàng)式特征,這個(gè)在機(jī)器學(xué)習(xí)算法里面用的很普遍,例如將線性模型通過(guò)添加二次項(xiàng)或者三次項(xiàng)使模型泛化能力更強(qiáng)。例如上面的圖片的例子。

3)減少正則化參數(shù),正則化的目的是用來(lái)防止過(guò)擬合的,但是現(xiàn)在模型出現(xiàn)了欠擬合,則需要減少正則化參數(shù)。

4)嘗試非線性模型,比如核SVM 、決策樹、DNN等模型。

(5)測(cè)試結(jié)果——過(guò)擬合

1、定義:模型把數(shù)據(jù)學(xué)習(xí)的太徹底,以至于把噪聲數(shù)據(jù)的特征也學(xué)習(xí)到了,這樣就會(huì)導(dǎo)致在后期測(cè)試的時(shí)候不能夠很好地識(shí)別數(shù)據(jù),即不能正確的分類,模型泛化能力太差。例如下面的例子。

上面左圖表示size和prize的關(guān)系,我們學(xué)習(xí)到的模型曲線如右圖所示,雖然在訓(xùn)練的時(shí)候模型可以很好地匹配數(shù)據(jù),但是很顯然過(guò)度扭曲了曲線,不是真實(shí)的size與prize曲線。

2、解決方法:

從產(chǎn)品角度

1)重新清洗數(shù)據(jù),導(dǎo)致過(guò)擬合的一個(gè)原因也有可能是數(shù)據(jù)不純導(dǎo)致的,噪音太多影響到模型效果,如果出現(xiàn)了過(guò)擬合就需要我們重新清洗數(shù)據(jù)。

2)增大數(shù)據(jù)的訓(xùn)練量,還有一個(gè)原因就是我們用于訓(xùn)練的數(shù)據(jù)量太小導(dǎo)致的,訓(xùn)練數(shù)據(jù)占總數(shù)據(jù)的比例過(guò)小。

從算法角度

1)交叉檢驗(yàn),通過(guò)交叉檢驗(yàn)得到較優(yōu)的模型參數(shù);

2)特征選擇,減少特征數(shù)或使用較少的特征組合,對(duì)于按區(qū)間離散化的特征,增大劃分的區(qū)間;

3)正則化,常用的有 L1、L2 正則。而且 L1正則還可以自動(dòng)進(jìn)行特征選擇;

4)如果有正則項(xiàng)則可以考慮增大正則項(xiàng)參數(shù) lambda;

5)增加訓(xùn)練數(shù)據(jù)可以有限的避免過(guò)擬合;

6)Bagging ,將多個(gè)弱學(xué)習(xí)器Bagging 一下效果會(huì)好很多,比如隨機(jī)森林等.

5)標(biāo)注流程中遇到的問(wèn)題

(1)項(xiàng)目過(guò)程中的不確定性:

1、出現(xiàn)原因:

一般情況下,只要數(shù)據(jù)標(biāo)注的規(guī)范清晰,對(duì)規(guī)則的界定從一而終,標(biāo)注工作的流程還是比較簡(jiǎn)單的。

數(shù)據(jù)標(biāo)注規(guī)范可能會(huì)在測(cè)試后根據(jù)結(jié)果情況進(jìn)行調(diào)整,那么,規(guī)則修改前后“數(shù)據(jù)標(biāo)注的一致性”就出現(xiàn)了問(wèn)題,會(huì)導(dǎo)致多次返工,在時(shí)間和人工成本上頗有影響。

2、解決方法:

1)如是分類性質(zhì)的解析工作,建議標(biāo)注規(guī)則先從非常肯定的非黑即白開始;規(guī)則設(shè)定由簡(jiǎn)到繁,帶有疑慮數(shù)據(jù)再另外作記號(hào)。隨著規(guī)則一步步深入,可能會(huì)出現(xiàn)交叉影響,此時(shí)就需要放棄一些低頻問(wèn)題的規(guī)則,余下的未標(biāo)注的數(shù)據(jù)就根據(jù)新的規(guī)則標(biāo)注。

2)如是多類規(guī)則同時(shí)進(jìn)行的標(biāo)注工作,需要把每類規(guī)則定得足夠細(xì)致。

3)實(shí)例:

1、如詢問(wèn)機(jī)器人會(huì)干什么的語(yǔ)料中出現(xiàn),“你說(shuō)你會(huì)干什么?”可以理解為詢問(wèn),也可能是嫌棄,這兩類應(yīng)對(duì)的策略不同,有歧義,所以不能把它歸納如詢問(wèn)類,需要把它從訓(xùn)練集里剔除。

2、如人臉情緒識(shí)別中,一個(gè)人在流眼淚,有時(shí)可以理解為傷心落淚,有時(shí)可以理解為喜極而泣,還有時(shí)可以理解為激動(dòng)落淚,甚至是感動(dòng)落淚等,所以在看到此類照片時(shí),不能簡(jiǎn)單的憑借慣性化思維將其歸納到悲傷一類中,當(dāng)人眼都很難判別清楚時(shí),需要把它從訓(xùn)練集里剔除。

5、實(shí)際案例分析

1)某領(lǐng)域的人臉識(shí)別監(jiān)測(cè)與身份確認(rèn)

(1)案例問(wèn)題:

光照影響:過(guò)暗或過(guò)亮等非正常光照環(huán)境,會(huì)對(duì)模型的效果產(chǎn)生很大干擾。在解決光照影響這個(gè)問(wèn)題上,可以通過(guò)兩種方式:

(2)解決方案:

1、從產(chǎn)品角度控制

A. 在用戶可以更換環(huán)境的前提下(比如銀行刷臉取錢等),可語(yǔ)音/界面提示用戶目前環(huán)境不理想(頭歪、頭發(fā)、眼鏡等),建議進(jìn)行正確的正臉取照。

B. 在用戶不能控制更換環(huán)境的情況下(比如人臉識(shí)別、車輛識(shí)別等攝像頭固定的場(chǎng)景),只能通過(guò)調(diào)試硬件設(shè)施彌補(bǔ)這個(gè)問(wèn)題。

C. 晚上:由于攝像頭在晚上會(huì)自動(dòng)切換到黑夜場(chǎng)景(從圖片上看就是從彩色切換為黑白),因此在晚上強(qiáng)光下(例如路燈照射)人臉就會(huì)過(guò)曝,這時(shí),我們可以通過(guò)強(qiáng)制設(shè)置攝像頭環(huán)境為白天(圖像為彩色)來(lái)避免。而過(guò)暗的情況,從節(jié)省成本角度看,可以在攝像頭旁邊增加一個(gè)光線發(fā)散、功率不高的燈來(lái)彌補(bǔ)。當(dāng)然這兩個(gè)問(wèn)題也可以通過(guò)購(gòu)買高質(zhì)量的攝像頭解決,但這樣做也意味著更高的成本。

D. 白天:白天也會(huì)出現(xiàn)光線過(guò)亮的情況,這種情況可以考慮用濾光片等等。

2、從算法角度控制

用算法將圖片進(jìn)行處理,可以將圖片恢復(fù)得讓人眼看清的程度。

2)某款人臉年齡識(shí)別產(chǎn)品

(1)案例問(wèn)題:

一款識(shí)別人臉年齡的產(chǎn)品對(duì)女性某個(gè)年齡階段(25—35)的判斷,誤差較大,經(jīng)過(guò)發(fā)現(xiàn),是因?yàn)樵撃挲g階段有以下特點(diǎn):

A. 女性在這個(gè)年齡階段面貌變化不是很大,有時(shí)人眼給出的判斷誤差都很離譜。

B. 在這個(gè)年齡層次的女性注重打扮,化妝品很大程度上掩蓋了其真實(shí)年齡,有時(shí)30多的跟20歲沒(méi)多大差別;C. 精裝打扮的和素顏的差別不是很大。

(2)解決方案:

1. 補(bǔ)充數(shù)據(jù):針對(duì)該年齡層次的人臉圖片數(shù)據(jù)做補(bǔ)充。不僅補(bǔ)充正例(“XXX”應(yīng)為多少歲),還應(yīng)補(bǔ)充負(fù)例(“XXX”不應(yīng)為多少歲)。

2. 優(yōu)化數(shù)據(jù):修改大批以往的錯(cuò)誤標(biāo)注。

3. 數(shù)據(jù)總結(jié):對(duì)化妝和不化妝的人臉圖片進(jìn)行分析,以便調(diào)整算法參數(shù)。

(3)需求研究:

1. 自拍:如女性群體一般都希望自拍時(shí),年齡的判別在心里預(yù)期中能越小越好,當(dāng)在和一群人自拍中可以適當(dāng)?shù)膶⒅魅斯哪挲g判別結(jié)果調(diào)低至達(dá)到用戶心理滿足感。此時(shí)可適當(dāng)降低算法的參照度。

2. 婚戀交友:在婚戀網(wǎng)站交友過(guò)程中,雙方都希望知道彼此的真實(shí)年齡信息,此時(shí)運(yùn)用人臉年齡識(shí)別可以分析雙方的年齡、皮膚等物理信息為彼此提供參考。此時(shí)的信息就不能以達(dá)到心理滿足感為主了,應(yīng)當(dāng)追求準(zhǔn)確度。

3)某款A(yù)R美顏相機(jī)

(1)無(wú)法定位出人臉:

在背景出現(xiàn)多人或?qū)櫸飼r(shí),相機(jī)有時(shí)并未能精確定位出目標(biāo)用戶,而定位到背景圖片中的人、寵物、身旁的其他人;有時(shí)屏幕一片漆黑;有時(shí)顯示未檢測(cè)出人臉。

1、從產(chǎn)品角度:

界面提醒用戶遠(yuǎn)離復(fù)雜背景,或美顏時(shí)最好屏幕中只出現(xiàn)一人,或給出方框圖讓用戶自己手動(dòng)選擇主要定位區(qū)域進(jìn)行AR美顏;屏幕一片漆黑時(shí)可提醒用戶是否是光線太暗,或是攝像頭被障礙物遮擋等;

2、從算法角度:

可對(duì)人臉關(guān)鍵點(diǎn)進(jìn)行定位,計(jì)算目標(biāo)用戶與攝像頭的距離或計(jì)算人臉在頻幕的區(qū)域占比來(lái)確定目標(biāo)用戶(一般幾何距離近的、頻幕區(qū)域占比較大的為美顏目標(biāo)),結(jié)合活體檢測(cè)來(lái)排除背景圖片人物的干擾等。

(2)圖像模糊昏暗:

光線太暗、運(yùn)動(dòng)、對(duì)焦等造成模糊(攝像頭距離因素,造成圖像低頻存在,高頻流失等)

1、從產(chǎn)品角度:

可提醒用戶在光線較溫和的區(qū)域進(jìn)行美顏操作;或是擦除前置攝像頭的障礙物;或文字提示動(dòng)作太快;或是更換高清前置攝像頭;或提示對(duì)焦失敗,給與對(duì)焦框圖讓用戶手動(dòng)對(duì)焦等。

2、從算法角度:

在美顏前可在后臺(tái)中調(diào)取手機(jī)亮度調(diào)節(jié)功能,用算法調(diào)節(jié)光線的亮暗程度以適應(yīng)美顏所需的物理?xiàng)l件;用算法設(shè)法補(bǔ)齊高頻部分從,而減少對(duì)照片的干擾。

(3)人臉關(guān)鍵動(dòng)作抓捕太慢:

在進(jìn)行AR美顏搞怪時(shí)(如張嘴動(dòng)作,屏幕出現(xiàn)音符、唾沫星子等)對(duì)動(dòng)作抓捕太慢(半天才抓捕到張嘴動(dòng)作)。

1、從產(chǎn)品角度:

文字提示不支持快速移動(dòng)或提示緩慢移動(dòng)(如,親!您的動(dòng)作太快了,奴家還未反應(yīng)過(guò)來(lái)等)

2、從算法角度:

人臉姿態(tài)估計(jì)、關(guān)鍵點(diǎn)定位來(lái)捕捉人臉動(dòng)作。

(4)關(guān)鍵位置添加虛擬物品失?。ㄈ缭谧焐系馃?、耳朵吊耳環(huán)、眼鏡戴墨鏡、臉顯紅暈)

1、從產(chǎn)品角度:

文字/圖片提醒用戶擺正人臉位置。

2、從算法角度:

可利用算法對(duì)人臉關(guān)鍵區(qū)域進(jìn)行分割并定位,來(lái)達(dá)到人臉精準(zhǔn)定位添加虛擬物品

4)人臉開門和人臉檢索

(1)人臉開門等跨網(wǎng)方案需要關(guān)注的因素

1、遠(yuǎn)程算法更新:

遠(yuǎn)程算法更新必然會(huì)造成本地局域網(wǎng)功能暫時(shí)性無(wú)法使用。因此遠(yuǎn)程算法更新的頻率、時(shí)間、更新效果都需要產(chǎn)品在更新前精確評(píng)估。

2、增刪改人臉數(shù)據(jù)與本地?cái)?shù)據(jù)的同步:

本地局域網(wǎng)和互聯(lián)網(wǎng)是無(wú)法直接交互的,因此用戶在互聯(lián)網(wǎng)一旦對(duì)人臉數(shù)據(jù)庫(kù)進(jìn)行增刪改的操作,下發(fā)程序的穩(wěn)定性和及時(shí)性都需要重點(diǎn)關(guān)注。

3、硬件環(huán)境:

本地存儲(chǔ)空間的大小和GPU直接影響到本地識(shí)別的速度。服務(wù)器的穩(wěn)定性影響到功能地正常使用。

4、守護(hù)程序:

斷電等外置情況意外情況發(fā)生又被處理完善后,程序能自動(dòng)恢復(fù)正常。

(2)人臉檢索等某一局域網(wǎng)方案需要關(guān)注的因素

1、速度:

除了算法識(shí)別需要消耗一定時(shí)間外,該局域網(wǎng)下的網(wǎng)速會(huì)影響到識(shí)別結(jié)果輸出的速度。

2、數(shù)據(jù)庫(kù)架構(gòu):

通過(guò)檢索結(jié)果關(guān)聯(lián)結(jié)構(gòu)化數(shù)據(jù)。

3、閾值的可配置性:

在界面設(shè)置閾值功能,從產(chǎn)品層面輸入閾值后,改變相對(duì)應(yīng)的結(jié)果輸出。

4、輸出結(jié)果排序:

根據(jù)相似度排序或結(jié)構(gòu)化數(shù)據(jù)排序內(nèi)容地抉擇

5、云服務(wù)的穩(wěn)定性。

5)曠視科技官網(wǎng)產(chǎn)品體驗(yàn)(多圖預(yù)警)

(1)年齡略有差距,自我估計(jì)+-5,性別基本無(wú)誤,頭部狀態(tài)略有誤差,人種誤差在30-40%(樣本量10,白種人和黃種人誤差明顯),情緒基本無(wú)誤,眼鏡種類識(shí)別有誤差(商品識(shí)別的范疇),強(qiáng)光狀態(tài)下表現(xiàn)不佳。

(2)邏輯錯(cuò)誤:左眼(睜眼、普通眼鏡)、右眼(墨鏡);相似度大(下圖為張一山和夏雨)的較難區(qū)分(雙胞胎估計(jì)很難區(qū)分)

(3)遠(yuǎn)距離檢測(cè)較難:左圖檢測(cè)出一張,右圖檢測(cè)出兩張(估計(jì)10米開外檢測(cè)不到)

(4)能夠識(shí)別蠟像、海報(bào)等非真人場(chǎng)景,因此在一些場(chǎng)合可欺騙攝像頭,如在金融領(lǐng)域里的身份識(shí)別,海關(guān)檢查等關(guān)鍵性應(yīng)用中,將會(huì)有風(fēng)險(xiǎn)。

(5)佩戴的口罩無(wú)法檢測(cè)出人臉

(6)公司體驗(yàn)對(duì)比結(jié)果

?6、項(xiàng)目虛擬實(shí)戰(zhàn)(以AR美顏APP為例,過(guò)程為理論經(jīng)驗(yàn)推理所得,自己并未實(shí)習(xí))

人臉檢測(cè)系統(tǒng)下,有很多FR相關(guān)的應(yīng)用,比如人臉屬性識(shí)別(年齡、表情、性別、種族等)、人臉美顏/美妝、人臉聚類等等。我們從AR美顏/美妝這一個(gè)例子著手,探索項(xiàng)目的具體流程。

1)項(xiàng)目前期準(zhǔn)備

(1)需求調(diào)研

1、場(chǎng)景及痛點(diǎn):

現(xiàn)在大多數(shù)美顏相機(jī)拍照后,都只有添加各種濾鏡、加幾個(gè)字、變白一點(diǎn),早已經(jīng)不能滿足廣大女性群體對(duì)于美顏的需求;加上如今年輕女性和男性的審美標(biāo)準(zhǔn)和獵奇心理都在發(fā)生改變,社交方式的趣味性也變得不同,比如原來(lái)大家可能在空間、朋友圈、直播上看到美女帥哥都會(huì)覺(jué)得很吸睛,點(diǎn)贊粉絲直奔而來(lái),但隨著快手和抖音的出現(xiàn),可以發(fā)現(xiàn)不僅僅是俊男靚女的照片和視頻能引起圍觀,同樣的各種普通群眾的搞怪合成視頻或合成照片(虛擬的AR特效帶來(lái)的各種浮夸造型)同樣能吸引無(wú)數(shù)粉絲的追捧,讓普通人也能享受被人膜拜的滿足感,而這些都需要用到人臉識(shí)別的相關(guān)技術(shù)。

(2)目標(biāo)用戶畫像分析:

1、了解目標(biāo)用戶的主流群體:

學(xué)生(大學(xué)生、高中生、初中生)群體對(duì)月美顏美妝的心理需求、時(shí)尚人士的美妝需求、長(zhǎng)相普通的人和長(zhǎng)相突出的人對(duì)于美顏的心理需求等。

2、了解用戶的年齡組成、地域分布對(duì)應(yīng)美妝的特點(diǎn)。

3、不同收入群體(白領(lǐng)、金領(lǐng)、藍(lán)領(lǐng)等)的美顏美妝需求關(guān)注點(diǎn)。

(3)市場(chǎng)分析:美顏美妝的市場(chǎng)規(guī)模,產(chǎn)業(yè)鏈,潛在的邊際效應(yīng)利益等。

2)文檔準(zhǔn)備

(1)需求文檔:

詳細(xì)的分析目前的用戶需求,針對(duì)不同群體,設(shè)計(jì)不同的產(chǎn)品解決方案,包括市場(chǎng)的需求文檔。

(2)數(shù)據(jù)文檔:

前期的人臉圖片收集、分發(fā)、標(biāo)注總結(jié)文檔(確定什么樣的圖片能要,什么樣的不能要),各種臉型(長(zhǎng)的、寬的、圓的、前額凸出的、眼睛深陷的等等)的分類,多少人完成眼睛美顏圖片的分類等。

(3)產(chǎn)品文檔:

1、場(chǎng)景落地文檔:如聽歌時(shí)頭上戴虛擬耳機(jī),嘆氣時(shí)嘴上叼煙,說(shuō)話時(shí)唾沫星子等針對(duì)不同的人臉姿態(tài)場(chǎng)景研究可能的落地產(chǎn)品形式。

2、產(chǎn)品的設(shè)計(jì)文檔:如美顏APP的頁(yè)面交互設(shè)計(jì)、導(dǎo)航設(shè)計(jì)、視覺(jué)呈現(xiàn)設(shè)計(jì)等;直播APP中的彈幕呈現(xiàn)設(shè)計(jì)、點(diǎn)贊分享按鈕設(shè)計(jì)等。

3、產(chǎn)品開發(fā)流程文檔:如PM先提交需求、可行性分析、立項(xiàng)、設(shè)計(jì)流程、開發(fā)流程,算法搭建、模型訓(xùn)練、測(cè)試訓(xùn)練等一系列流程的步驟及跟進(jìn)。

4、模型訓(xùn)練及測(cè)試文檔:數(shù)據(jù)標(biāo)注好后,喂給算法,搭建人臉識(shí)別美顏的模型框架,如前期用成千上萬(wàn)的照片訓(xùn)練機(jī)器的人臉關(guān)鍵點(diǎn)定位,讓機(jī)器找準(zhǔn)鼻子、眼睛、耳朵、嘴等位置等。

3)數(shù)據(jù)標(biāo)注

(1)數(shù)據(jù)圖片的采集:

在文檔的指引下,從公開網(wǎng)站上爬取收集符合模型訓(xùn)練的人臉圖片、或是運(yùn)用公司的數(shù)據(jù)圖片等。

(2)數(shù)據(jù)圖片的標(biāo)注:

在標(biāo)注規(guī)范文檔的指引下,將圖片分發(fā)給標(biāo)注團(tuán)隊(duì)進(jìn)行數(shù)據(jù)的標(biāo)注,對(duì)一些模棱兩可的圖片,如圖片中的人臉較模糊,此時(shí)該照片是要還是不要,期間應(yīng)與算法同事保持溝通,有時(shí)暗的圖片在算法的優(yōu)化中能準(zhǔn)確識(shí)別,這樣增加實(shí)際情況的容錯(cuò)率(實(shí)際中較暗的人臉圖像也能定位出關(guān)鍵部位),那么這張圖片則視為有效數(shù)據(jù);有時(shí)較暗的圖片經(jīng)過(guò)算法之后并不能達(dá)到要求(及無(wú)法定位出人臉關(guān)鍵點(diǎn)),此時(shí)這照片則視為無(wú)效數(shù)據(jù),直接剔除;但是標(biāo)注團(tuán)隊(duì)并不知道這張圖片是有效還是無(wú)效,所以標(biāo)注過(guò)程中,算法同事也需間接參與進(jìn)來(lái)。

(3)數(shù)據(jù)的反饋:

在部分圖片標(biāo)注過(guò)程后,交于算法同事訓(xùn)練模型調(diào)節(jié)參數(shù),期間將測(cè)試后的數(shù)據(jù)(精確率和召回率的計(jì)算,來(lái)反映數(shù)據(jù)的標(biāo)注結(jié)果)反饋給還在標(biāo)注的人員,有時(shí)可能造成過(guò)擬合有時(shí)可能造成欠擬合等方便對(duì)數(shù)據(jù)進(jìn)行重新操作。

4)項(xiàng)目流程跟蹤

(1)產(chǎn)品立項(xiàng)后,每天的任務(wù)管理,流程進(jìn)度跟蹤,產(chǎn)出時(shí)間管理,開會(huì)反饋工作成果等。

(2)軟硬件端:在開發(fā)流程文檔的指引下,按照常規(guī)的軟硬件跟蹤開發(fā)。

(3)算法流程:

人臉采集、人臉檢測(cè)、圖像的預(yù)處理(模糊的則用算法去模糊等)、人臉特征提取、圖像的匹配識(shí)別、AR虛擬等。

5)項(xiàng)目測(cè)試:

1、手機(jī)攝像頭測(cè)試

2、平臺(tái)后臺(tái)程序測(cè)序

3、算法與平臺(tái)后臺(tái)測(cè)試

4、模型識(shí)別時(shí)間、準(zhǔn)確率、召回率測(cè)試

5、服務(wù)器穩(wěn)定性測(cè)試

6、網(wǎng)絡(luò)帶寬限制測(cè)試

7、其他平臺(tái)、硬件產(chǎn)品常規(guī)測(cè)試

8、目標(biāo)用戶使用測(cè)試

6)項(xiàng)目?jī)?yōu)化:經(jīng)過(guò)各種測(cè)試之后,針對(duì)反饋回來(lái)的數(shù)據(jù)進(jìn)行產(chǎn)品的優(yōu)化

如一張嘴就給你來(lái)根煙,結(jié)果煙插到鼻子上了,這就明顯是沒(méi)有定位到人臉關(guān)鍵點(diǎn),是數(shù)據(jù)的原因還是算法的原因,這些都要經(jīng)過(guò)優(yōu)化處理;經(jīng)過(guò)種子用戶測(cè)試后,反饋得知這個(gè)點(diǎn)贊按鈕操作起來(lái)有點(diǎn)別扭,應(yīng)該怎樣怎樣,這時(shí)可能要與設(shè)計(jì)的同學(xué)討論一下,該怎樣優(yōu)化產(chǎn)品的設(shè)計(jì)和體驗(yàn)。

7)項(xiàng)目驗(yàn)收上線

產(chǎn)品按照流程功能進(jìn)行驗(yàn)收后上線。

六、FR的個(gè)人看法

1)人臉識(shí)別的現(xiàn)狀

(1)實(shí)驗(yàn)室效果和現(xiàn)實(shí)效果對(duì)比,差距巨大

現(xiàn)如今的人臉識(shí)別技術(shù)在金融、安防等領(lǐng)域的應(yīng)用實(shí)際上的效果要比實(shí)驗(yàn)室里的差很多,前陣子西安的某高校引入人臉識(shí)別晨讀打卡,由于反應(yīng)速度太慢,到中午還排著很長(zhǎng)的隊(duì)??梢妼?shí)際生活中,由于各種物理因素(光照、角度、對(duì)焦、人魚攝像頭的距離等)導(dǎo)致抓拍的圖片質(zhì)量比較差,又經(jīng)過(guò)網(wǎng)絡(luò)傳輸?shù)骄钟蚓W(wǎng)/互聯(lián)網(wǎng)進(jìn)行對(duì)比(網(wǎng)絡(luò)差的過(guò)程中,反應(yīng)很慢),使得實(shí)際效果大打折扣。大多數(shù)情況下,實(shí)際抓拍圖像質(zhì)量遠(yuǎn)低于訓(xùn)練圖像質(zhì)量。

(2)訓(xùn)練時(shí)的標(biāo)準(zhǔn)和實(shí)際應(yīng)用的標(biāo)準(zhǔn)

大多數(shù)情況下,實(shí)際應(yīng)用的標(biāo)準(zhǔn)會(huì)遠(yuǎn)高于訓(xùn)練標(biāo)準(zhǔn)。例如,人臉識(shí)別實(shí)驗(yàn)室的標(biāo)準(zhǔn)是通過(guò)正臉數(shù)據(jù)訓(xùn)練出模型,能識(shí)別正確人臉就可以。而實(shí)際情況可能沒(méi)有正臉數(shù)據(jù),對(duì)訓(xùn)練提出了更高的要求。

(3)訓(xùn)練效果和現(xiàn)實(shí)效果

大多數(shù)情況下,實(shí)際效果會(huì)遠(yuǎn)低于訓(xùn)練效果?,F(xiàn)在市面上CV公司都是說(shuō)自己的訓(xùn)練效果在99%以上(無(wú)限接近于100%),但這不等于實(shí)際應(yīng)用的效果就是99%。工業(yè)上場(chǎng)景復(fù)雜的人臉應(yīng)用(類似識(shí)別黑名單這種1:N的人臉比對(duì))正確率在90%以上就已經(jīng)是表現(xiàn)得很好的算法模型。

2)未來(lái)發(fā)展趨勢(shì)的思考:

隨著人工智能的火熱和發(fā)展,在全球信息化、云計(jì)算、大數(shù)據(jù)的背景下,生物識(shí)別技術(shù)的應(yīng)用面會(huì)越來(lái)越大,由以人臉識(shí)別為其中代表。以下幾個(gè)發(fā)展趨勢(shì)呈現(xiàn):

(1)網(wǎng)絡(luò)化趨勢(shì)

人臉識(shí)別解決了日常生活中一個(gè)基本的身份識(shí)別問(wèn)題,今后,這總身份認(rèn)證的結(jié)果會(huì)越來(lái)越多的和各行各業(yè)應(yīng)用結(jié)合起來(lái),并通過(guò)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)得以信息共享,簡(jiǎn)單來(lái)說(shuō)就是“身份識(shí)別+物聯(lián)網(wǎng)”的發(fā)展趨勢(shì)未來(lái)將十分普遍。

(2)多生物識(shí)別模式融合趨勢(shì)

人臉識(shí)別技術(shù)現(xiàn)如今的還達(dá)不到人類的預(yù)期體驗(yàn),對(duì)于一些安全性要求高的特殊行業(yè)應(yīng)用,如金融行業(yè),人臉識(shí)別很容易被不法分子攻破漏洞進(jìn)行身份造假,因此需要多種生物特征識(shí)別技術(shù)的融合應(yīng)用(如活體檢測(cè)、虹膜識(shí)別等)以進(jìn)一步提高身份識(shí)別的整體安全性。

(3)云技術(shù)

未來(lái)的云技術(shù)也將大大給人臉識(shí)別的應(yīng)用提供數(shù)據(jù)和計(jì)算力支持,基于云技術(shù)的門禁控制可以同時(shí)管理成百上千的通道,加上物聯(lián)網(wǎng)的普及,用戶對(duì)任何地方的門禁進(jìn)行遠(yuǎn)程控制和管理,準(zhǔn)確識(shí)別本人,將廣泛應(yīng)用到企業(yè)、學(xué)校、培訓(xùn)機(jī)構(gòu)、大型商業(yè)場(chǎng)合、辦公大樓的門禁解決方案。

3)盈利模式的思考

(1)單一盈利模式

1、現(xiàn)如今的人臉識(shí)別技術(shù)服務(wù)商,都以將技術(shù)接入第三方應(yīng)用軟件,或是搭載在智能終端上,通過(guò)收取一定技術(shù)服務(wù)費(fèi)來(lái)獲取盈利。目前國(guó)內(nèi)的第一梯隊(duì)創(chuàng)業(yè)公司都在技術(shù)和數(shù)據(jù)上沉淀,而是否盈利,盈利多少都還尚不明確。

2、如在金融領(lǐng)域,人臉識(shí)別用于身份確認(rèn),然而身份確認(rèn)之后,就沒(méi)你什么事,你跟用戶的關(guān)系只在于,打開某款A(yù)PP或某個(gè)終端場(chǎng)景(閘機(jī))的鑰匙,打開之后,用戶的所有行為都沉浸在APP中,并沒(méi)有給FR技術(shù)服務(wù)商帶來(lái)其他的使用數(shù)據(jù)及用戶行為信息;從根本上來(lái)看,用戶只是用鑰匙開了門,而往往是門里面的東西(用戶數(shù)據(jù))才能帶來(lái)商業(yè)價(jià)值。

(2)對(duì)比互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)

1、互聯(lián)網(wǎng)時(shí)代早期有很多功能性的產(chǎn)品。如早年間的QQ只有聊天的功能;360用戶只是用它來(lái)給電腦殺殺毒;百度就是個(gè)即問(wèn)即答的老師;搜狐、新浪也就是用來(lái)看看新聞而已。

2、移動(dòng)互聯(lián)網(wǎng)時(shí)代也有很多這樣的產(chǎn)品。滴滴幫用戶叫個(gè)車;高德也就差不多是古代的指南針。

3、案例分析:眾所周知,上面舉的例子不是互聯(lián)網(wǎng)時(shí)代的高市值企業(yè),就是移動(dòng)互聯(lián)網(wǎng)時(shí)代高融資率的企業(yè)。

1)QQ后來(lái)用戶數(shù)越來(lái)越多,QQ號(hào)成網(wǎng)絡(luò)身份的一個(gè)必不可少的身份屬性之一,用戶大量的數(shù)據(jù)沉淀在其中,通過(guò)用戶的使用行為信息,小馬哥知道了這么多人都用我的QQ,那趕緊搞個(gè)什么娛樂(lè)活動(dòng),讓有QQ號(hào)的人都來(lái)玩,于是就有了龐大的游戲帝國(guó)產(chǎn)業(yè),游戲里面又加上各種鉆(什么粉鉆、綠鉆、紫鉆、黑鉆)對(duì)應(yīng)的各種會(huì)員機(jī)制,QQ號(hào)又以其他的方式來(lái)獲取用戶的行為信息如,QQ音樂(lè)(下歌要錢、換皮膚要錢)、騰訊視頻(各種廣告收入、會(huì)員充錢等)、QQ郵箱(會(huì)員高級(jí)功能)等,讓人們?cè)郊映两赒Q帝國(guó)的生態(tài)圈中,莫名其妙的就被吸走了很多錢??赡苣銜?huì)說(shuō)我還可以用其他的呀,但是好煩啊,這個(gè)也要注冊(cè),那個(gè)也要注冊(cè),明明一個(gè)QQ號(hào)可以玩轉(zhuǎn)所有,沒(méi)辦法我就是這么懶,所以說(shuō)懶人創(chuàng)造了這個(gè)世界的絕大多數(shù)科技產(chǎn)品。

2)滴滴現(xiàn)如今估值幾百億美刀,投資人為何給一個(gè)只幫你叫車的公司如此高的估值,我們知道滴滴打車比一般的直接叫車要便宜一點(diǎn)點(diǎn)(專車除外),那它的盈利點(diǎn)從而來(lái),投資人有看中了它的哪一點(diǎn)。其實(shí)不難理解,滴滴之所以有如今的估值,正因?yàn)槠鋷缀鯄艛嗔藝?guó)內(nèi)的打車市場(chǎng),大量的用戶使用它,必然就會(huì)有用戶的使用數(shù)據(jù),而這些數(shù)據(jù)便是變現(xiàn)的好東西,一旦整個(gè)生態(tài)搭建完畢,未來(lái)滴滴就將這些數(shù)據(jù)用無(wú)人駕駛方面,一旦搶占了市場(chǎng)的制高點(diǎn),未來(lái)在行業(yè)鏈上就有絕對(duì)的議價(jià)能力。比如現(xiàn)在人們已經(jīng)習(xí)慣了去一個(gè)陌生地方,就來(lái)一個(gè)滴滴打車,若滴滴突然漲價(jià),一公里漲幾毛或一元,你用它還是不用;心理學(xué)表明,人養(yǎng)成一個(gè)習(xí)慣之后,就會(huì)有慣性,對(duì)于沒(méi)有超出心理承受預(yù)期的東西(不是漲價(jià)漲得特別離譜),人們會(huì)一直保持這個(gè)習(xí)慣中的一些行為,而不愿做出改變(也就是常說(shuō)的人有一種惰性)。因此我想大多數(shù)人都會(huì)去接受,因?yàn)榭赡苣慊〞r(shí)間自己打車也是需要很多成本的;用戶基數(shù)比較大,那這個(gè)漲了幾毛的就會(huì)帶來(lái)不少的盈利空間(中國(guó)十幾億人口,一人給我一毛錢,我都能成為億萬(wàn)富翁了,但對(duì)別人而言,一毛錢可能連袋辣條都買不到),這還只是一方面。

4、人臉識(shí)別作為一種技術(shù),并沒(méi)有實(shí)際的產(chǎn)品承載點(diǎn)。以上分析中的種種產(chǎn)品,你都能叫出來(lái)名字,是因?yàn)檫@些功能或是技術(shù)都有一個(gè)實(shí)際的產(chǎn)品承載點(diǎn),比如QQ用了即時(shí)通訊技術(shù),頭條背后的智能推薦用了機(jī)器學(xué)習(xí)相關(guān)技術(shù),但在我們心目中它不是以一種技術(shù)停留在我們的心智空間里,它是一款實(shí)實(shí)在在的產(chǎn)品,我們可以操作它,使用它。無(wú)論是QQ還是滴滴、高德、今熱頭條、新浪等等,這些產(chǎn)品我們都能實(shí)實(shí)在在的接觸到,并且后續(xù)行為都在這個(gè)技術(shù)的承載點(diǎn)里(如即時(shí)通訊技術(shù)的產(chǎn)品承載點(diǎn)是QQ,機(jī)器學(xué)習(xí)技術(shù)的產(chǎn)品承載點(diǎn)是頭條),那么用戶的數(shù)據(jù)自然也就在產(chǎn)品承載點(diǎn)之中,這樣我們才能應(yīng)用數(shù)據(jù)來(lái)創(chuàng)造價(jià)值,從而實(shí)現(xiàn)盈利。

5、人臉識(shí)別目前的階段停留在大眾視野里只是一種技術(shù),人們的潛意識(shí)里并沒(méi)有建立起一個(gè)概念,那就是這個(gè)人臉識(shí)別到底是個(gè)什么東西,我能操作它嗎?它能給我?guī)?lái)什么呢?而一旦人臉識(shí)別有一個(gè)產(chǎn)品承載點(diǎn),讓用戶能實(shí)實(shí)在在的進(jìn)行操作,并有數(shù)據(jù)積累,才會(huì)有盈利的可能。而人臉識(shí)別的產(chǎn)品承載點(diǎn)是什么,目前還都沒(méi)有出現(xiàn),未來(lái)肯定會(huì)有,這也是未來(lái)的一大機(jī)會(huì),無(wú)論是什么,這個(gè)產(chǎn)品必然都能被用戶實(shí)實(shí)在在的接觸到,并且后續(xù)也都將在其中產(chǎn)生行為,后者是必要條件。

4)信息安全的思考

一旦前面提到的產(chǎn)品承載點(diǎn)出現(xiàn),F(xiàn)R技術(shù)必將大行其道,隨之而來(lái)的可能是信息安全問(wèn)題。

物聯(lián)網(wǎng)時(shí)代之下,萬(wàn)物互聯(lián),萬(wàn)物智能,F(xiàn)R技術(shù)也必將融入到物聯(lián)網(wǎng)之中,人們可能都不需要身份類的實(shí)物證件?;丶议_門掃臉,外出開車門掃臉,進(jìn)公司掃臉,出去吃飯付錢掃臉。當(dāng)人臉成為你的虛擬證件時(shí),一旦又不法公司、團(tuán)體、個(gè)人泄露或是破解了你的人臉虛擬證件,那么你的一切信息可能都暴露在他人面前,財(cái)產(chǎn)、房子、車子可能都有風(fēng)險(xiǎn),還有可能因?yàn)閬G失人臉證件,將無(wú)法證明你自己的身份,就像你丟了身份證一樣??上攵畔踩闹匾?,未來(lái)估計(jì)會(huì)誕生一個(gè)虛擬身份信息系統(tǒng),里面有每一個(gè)人的身份信息,當(dāng)?shù)谌叫枰矸菡J(rèn)證時(shí),可接入系統(tǒng)等。前陣子臉書因?yàn)樯缃恍畔⑿孤抖巧媳娕鸸P(guān)麻煩。我想未來(lái)如果有一個(gè)公司專門負(fù)責(zé)用戶信息數(shù)據(jù)的監(jiān)管,我也不會(huì)覺(jué)得很奇怪的。

5)產(chǎn)品形式的思考

(1)可接觸性:

無(wú)論FR技術(shù)最終是以硬件還是軟件方式出現(xiàn)在用戶面前,前提是用戶能夠?qū)嶋H的接觸到,而不是仿佛在云端不可觸摸,只有用戶接觸了,才能在心里產(chǎn)生出它是一款產(chǎn)品,而不是一項(xiàng)技術(shù)的概念。如AR美顏就是實(shí)實(shí)在在可操作的產(chǎn)品。

(2)連續(xù)使用性(高頻性):

產(chǎn)品必須是用戶能連續(xù)使用的,也就是所謂的高頻性,只有這樣才能產(chǎn)生可利用的信息數(shù)據(jù)來(lái)變現(xiàn)。

(3)功能承載性:

產(chǎn)品要能以一種功能的方式為用戶解決生活中的某一類問(wèn)題。人臉除了身份認(rèn)證(金融行業(yè)、安防門禁)、視覺(jué)欣賞(美顏美妝、整容)、社交評(píng)判依據(jù)(婚戀網(wǎng)站)還能用來(lái)干什么呢?

(4)To C or To B:

結(jié)合互聯(lián)網(wǎng)時(shí)代的發(fā)展,我個(gè)人始終認(rèn)為一款產(chǎn)品只有圍繞用戶提供服務(wù),才有可能成就明星產(chǎn)品。從歷史的角度來(lái)看,每一個(gè)王朝的興衰更替都是以老百姓的意愿為轉(zhuǎn)移,有道是“水能載舟亦能覆舟”。產(chǎn)品亦是如此,產(chǎn)品概念誕生到現(xiàn)在,每一款產(chǎn)品的興衰也都是建立在用戶的基礎(chǔ)之上。任何一款產(chǎn)品拋開用戶之后都只能死亡,盡管目前FR大層面上應(yīng)用在B端,但是未來(lái)成功的FR應(yīng)用產(chǎn)品必然是誕生在C端。

?

?下面附上總結(jié)這篇系列文章的思路導(dǎo)圖:

?

?

?下面是參考文檔鏈接

刷臉時(shí)代來(lái)臨,深度解析人臉識(shí)別技術(shù)市場(chǎng) ?www.eepw.com.cn

簡(jiǎn)述人臉識(shí)別系統(tǒng)的應(yīng)用及目前存在的技術(shù)難點(diǎn) ?www.sohu.com

人臉識(shí)別遇到的問(wèn)題及相應(yīng)的解決方法 - CSDN博客 ?blog.csdn.net

人臉識(shí)別關(guān)鍵問(wèn)題研究(光照、姿態(tài)) - CSDN博客 ?blog.csdn.net

動(dòng)態(tài)人臉識(shí)別技術(shù)的難點(diǎn)與解決思路_百度文庫(kù) ?wenku.baidu.com

站在信息安全角度 人臉識(shí)別面臨五大問(wèn)題 ?www.sohu.com

刷臉時(shí)代來(lái)臨,深度解析人臉識(shí)別技術(shù)市場(chǎng) ?www.eepw.com.cn

人臉識(shí)別技術(shù)的優(yōu)勢(shì)及在金融行業(yè)的應(yīng)用 ?www.docin.com

人臉識(shí)別行業(yè)分析報(bào)告 - 簡(jiǎn)書

作者:放飛人夜

鏈接:http://m.itdecent.cn/p/639e3f8b7253

來(lái)源:簡(jiǎn)書

簡(jiǎn)書著作權(quán)歸作者所有,任何形式的轉(zhuǎn)載都請(qǐng)聯(lián)系作者獲得授權(quán)并注明出處。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容