音視頻處理

音視頻處理

數(shù)據(jù)采集。對(duì)于音頻來說采集到的數(shù)據(jù)是PCM格式,對(duì)于視頻數(shù)據(jù)采集的格式是YUV格式。

數(shù)據(jù)壓縮編碼。數(shù)據(jù)采集完成之后,需要對(duì)數(shù)據(jù)進(jìn)行壓縮編碼。音視頻使用的壓縮技術(shù)稱為有損壓縮技術(shù)。而像我們平RAR,ZIP工具進(jìn)行的壓縮都是無損壓縮。就是說解壓后的數(shù)據(jù)與原始數(shù)據(jù)一樣叫做無損壓縮,解壓后和原始數(shù)據(jù)高度接近稱為有損壓縮,音視頻編碼屬于后者。對(duì)于音頻來講,常用的編碼格式有speex, AAC, OPUS, G.711等?,F(xiàn)在比較常用的是AAC,一是它音質(zhì)比較好,二是RTMP對(duì)AAC支持的比較好。對(duì)于視頻編碼格式有H.264, H.265, VP8, VP9等,目?;旧隙际鞘褂肏.264。注意,衡量有損壓縮好壞的指標(biāo)就是看同等壓縮率的情況下,解壓后的數(shù)據(jù)與原始數(shù)據(jù)之間差別的大小,差別越小證明壓縮的算法越優(yōu)。當(dāng)然在實(shí)時(shí)互動(dòng)直播中,我們?yōu)榱藢?shí)時(shí)性就需要犧牲一部分質(zhì)量或者也有可能為了質(zhì)量而犧牲一些實(shí)時(shí)性,這需要仔細(xì)的權(quán)衡。

傳輸。數(shù)據(jù)壓縮完之后通過網(wǎng)絡(luò)傳輸。對(duì)于泛娛樂化的直播平臺(tái)一般都使用RTMP協(xié)議進(jìn)行數(shù)據(jù)的傳輸,RTMP是在TCP之上的網(wǎng)絡(luò)協(xié)議。對(duì)于實(shí)時(shí)互動(dòng)直播則必須使用UDP進(jìn)行數(shù)據(jù)傳輸。 UDP數(shù)據(jù)的傳輸速度上比TCP有天然的優(yōu)勢(shì)。RTMP是Adobe公司發(fā)明一種傳輸協(xié)議,目前所有的CDN網(wǎng)絡(luò)對(duì)RTMP的支持是非常好的,但它的問題就是延遲性比較大。使用RTMP造成延遲主要有兩個(gè)方面原因,一是RTMP網(wǎng)絡(luò)協(xié)議由于是基于TCP協(xié)議的,本身延遲就比UDP大,另一方面是CDN架構(gòu)造成的。CDN首先從頂級(jí)結(jié)點(diǎn)接收數(shù)據(jù),然后以樹狀形式分發(fā)到端結(jié)點(diǎn),這個(gè)過程鏈條比較長,導(dǎo)致整體的延遲非常大。而且延遲時(shí)間不固定,有可能某段時(shí)間延遲3?5秒,也有可能過一段時(shí)間延遲就達(dá)到了30秒這都是有可能的。

解碼。就是將對(duì)編碼數(shù)據(jù)做反向操作。如音頻是AAC編碼,則它再解為PCM格式數(shù)據(jù)。視頻是H.264再解為YUV數(shù)據(jù)。

播放和渲染。對(duì)于音頻直接將PCM數(shù)據(jù)放入到音頻驅(qū)動(dòng)緩沖驅(qū),驅(qū)動(dòng)程序就會(huì)將音頻播放出來。對(duì)于視頻一般會(huì)通過 opengl利用 GPU進(jìn)行圖像渲染。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • [TOC] 音視頻&流媒體 是什么促使我要寫這一篇音視頻入門文章?那是因?yàn)楹鸵幻米哟蛸€碼率的概念,結(jié)果輸了;對(duì)一個(gè)...
    AllenWu閱讀 5,188評(píng)論 1 24
  • 以前做視頻播放器開發(fā)的時(shí)候,只知道請(qǐng)求服務(wù)器,然后服務(wù)器返回一個(gè)播放串。這樣視頻就播放了 其它的操作比如UI定...
    若幹年後閱讀 3,338評(píng)論 8 38
  • 數(shù)字音頻基本概念 在實(shí)現(xiàn)功能之前,我們先來了解一下數(shù)字音頻的有關(guān)屬性: 采樣頻率(Sample Rate):每秒采...
    鄭旭澤閱讀 7,820評(píng)論 3 13
  • AAC是音頻的一種編碼格式,AAC通常壓縮比為18:1,也有資料說為20:1,遠(yuǎn)勝mp3。 AAC音頻格式有ADI...
    鄭旭澤閱讀 9,845評(píng)論 11 20
  • 又一次接觸概率統(tǒng)計(jì)學(xué),發(fā)現(xiàn)了這門以前高中數(shù)學(xué)就已經(jīng)學(xué)習(xí)課程,如今給我們帶來如此多的紅利。 我試著自己分析一些網(wǎng)絡(luò)上...
    張大俠丶閱讀 256評(píng)論 0 0

友情鏈接更多精彩內(nèi)容