前面幾篇文章在以iOS客戶端為例的情況下,大致說了kaldi部署在服務(wù)端的在線識別,以及kaldi在iOS項目中的本地識別。因為所研究的東西最終都是要在實際的項目中或者產(chǎn)品中去使用,所以為了更好的看到自己所研究的東西的結(jié)果,我才做了前面的一些demo來實際的看到效果和使用情況。當(dāng)然后面還有好玩的,我都會發(fā)出實際應(yīng)用的demo出來。文章我還會繼續(xù)更新,因為后面好玩的還有聲紋識別,命令詞喚醒。
在線識別
在線識別簡單的理解就是將解碼器放在服務(wù)端,以kaldi為環(huán)境來識別。解碼這一塊kaldi也提供了文件解碼的例子,可以稍加改造用于實時流識別,當(dāng)然我也將改造后的解碼代碼放在前面的文章中,有需要的可以參考。
參考demo:https://github.com/andyweiqiu/SpeechRecognition
本地識別
這里的本地識別是將kaldi源代碼編譯成庫放到iOS或者Android項目中,以提供解碼的環(huán)境。當(dāng)然難點就是kaldi的編譯。解碼這一套都是通用的,不管是在線識別還是本地識別。我這里也提供了demo,有需要驗證自己模型的,可以下載demo,在工程中直接替換模型文件,運行,不用管其他實現(xiàn)。在運行demo的過程中有任何問題可以直接聯(lián)系我。