最近在做相關(guān)項(xiàng)目,評(píng)估了多個(gè)數(shù)據(jù)標(biāo)注工具,也接觸了幾家數(shù)據(jù)標(biāo)注公司和平臺(tái),總結(jié)如下,供各位參考。
視頻數(shù)據(jù)標(biāo)注平臺(tái)(標(biāo)注外包公司)
數(shù)據(jù)標(biāo)注公司的工作比較多樣,但視頻標(biāo)注對(duì)工具要求稍高一些,能在線上做的平臺(tái)不是特別多,主要還是語音、圖片標(biāo)注。目前這個(gè)行業(yè)良莠不齊,有的平臺(tái)技術(shù)實(shí)力強(qiáng),有品牌背景,比如京東眾智、百度眾包,數(shù)據(jù)保密做得好。有的平臺(tái)是專門做代理的,你的數(shù)據(jù)需求交給他,他轉(zhuǎn)手就分包給下一層。下面介紹幾個(gè)平臺(tái),也綜合了其他博主的一些意見,如下:
京東眾智
標(biāo)注質(zhì)量比較高,項(xiàng)目交付準(zhǔn)時(shí),數(shù)據(jù)隔離方案可以不出自己的服務(wù)器完成標(biāo)注,比較重視客戶的數(shù)據(jù)安全。也提供私有化部署服務(wù)。
百度眾測
標(biāo)注能力比較廣泛,百度進(jìn)入標(biāo)注行業(yè)比較久,積累了較多的眾包用戶。不過我不看好眾包模式,因?yàn)橘|(zhì)量比較難把控。
figure-eight
國外知名的數(shù)據(jù)標(biāo)注平臺(tái),國外好多大公司都與它有合作。需求方可以自行配置標(biāo)注工具和相應(yīng)的label,直接在平臺(tái)上發(fā)任務(wù),沒有客戶經(jīng)理溝通…這可能對(duì)國內(nèi)客戶不太友好。
視頻數(shù)據(jù)標(biāo)注工具
CDVA
CDVA(compact descriptor for video analysis),主要是基于CDVS中的緊湊視覺描述子來做視頻分析,之前是緊湊視覺描述子主要應(yīng)用在圖像檢索領(lǐng)域。需要制作新的數(shù)據(jù)集,對(duì)視頻幀進(jìn)行標(biāo)注,所以根據(jù)網(wǎng)上一個(gè)博主的標(biāo)注工具進(jìn)行了一定的修改,實(shí)現(xiàn)的功能是在每一幀中將需要標(biāo)注的區(qū)域用鼠標(biāo)選取4個(gè)點(diǎn),順序是順時(shí)針。因?yàn)樗倪呅蔚姆秶鼜V,之前的一些人直接標(biāo)注了矩形,但是在一些仿射變換中,往往矩形的定位效果不好,矩形定位應(yīng)該比較適合于人臉定位和行人定位之中。
http://www.cnblogs.com/louyihang-loves-baiyan/p/4457462.html
VoTT
微軟發(fā)布的可視化圖像/視頻標(biāo)記工具。能夠標(biāo)記和注釋圖像目錄或獨(dú)立視頻。使用 Camshift 跟蹤算法輔助計(jì)算機(jī)標(biāo)記和跟蹤視頻中的物體。將標(biāo)簽和資源導(dǎo)出到 Custom Vision Service CNTK,Tensorflow(PascalVOC)或YOLO 格式,用于訓(xùn)練對(duì)象檢測模型。
https://github.com/Microsoft/VoTT
vatic
具體安裝請(qǐng)參考:https://blog.csdn.net/baidu_26788951/article/details/80053760