音頻學(xué)習(xí):
聲波三要素:頻率,振幅,波形。
頻率:音階的高低
振幅:響度
波形:音色
頻率
頻率越高,波長起短,低頻的聲波更容易障過障礙物,聲音傳播越遠(yuǎn)
響度,能量的反饋,分貝來描述響度
音色,
模擬信號數(shù)字化的過程,分別是采樣,量化和編碼
音頻采樣
在時間軸上對信號進(jìn)行數(shù)字化
44.1kHZ表示1秒會采樣441000次
量化
在幅度軸上對信號進(jìn)行數(shù)字化,簡單來說就是聲音波形的數(shù)據(jù)是多少位的二進(jìn)制數(shù)據(jù),通常用bit做單位,
編碼
按照一定格式記錄采樣和量化后的數(shù)據(jù)
音頻編碼格式有多種,通常所說的音頻裸數(shù)指的是脈沖編碼調(diào)制PCM數(shù)據(jù).
如果想要描述一份PCM數(shù)據(jù)需要(量化格式,采樣這,聲道數(shù))
CD為例,量化16bite,采樣率441000,聲道數(shù)為2
比特率:44100 * 16 * 2 = 1378.125kbps
一分鐘占用內(nèi)存:1378.125 * 60 /8/1024 = 10.09MB
二、音頻編碼
如果按CD音質(zhì)進(jìn)行采樣,各個角度來說都太大了,所以我們需要進(jìn)行壓縮編碼
壓縮編碼的可能性
壓縮編碼的基本指標(biāo)就是壓縮比,
壓縮算法分2種,有損壓縮和無損壓縮
無損:解壓后可以完全復(fù)原
有損,解壓后不能完全復(fù)原,會丟失一部分信息。壓縮比越小,丟失的信息就越多,信號還原的失真就會越大
壓縮編碼的原理實際上就是壓縮冗余的信號。冗余信號就是指不能被人耳感知的信號。包括人耳聽覺范圍外的音頻信號以及被掩蓋掉的音頻信號
常用的壓縮編碼格式
WAV編碼
WAV編碼的一種實現(xiàn)方式。就是在源PCM數(shù)據(jù)格式前面加上44個字節(jié)。分別用來描述PCM的采樣率,聲道數(shù),數(shù)據(jù)格式等信息
特點:音質(zhì)非常好,大量軟件都支持其播放
適用場合:多媒體開發(fā)的中間文件,保存音樂和音效素材
MP3編碼
MP3編碼具有不錯的壓縮比,聽感接近WAV,在不同的環(huán)境下,調(diào)整參數(shù)可達(dá)更好效果
特點:音質(zhì)在128Kbit/s以上表現(xiàn)不錯,壓縮比比較高。大量軟件硬件都支持,兼容性高
適用場合:高比特率下對兼容性有要求的音樂欣賞
AAC編碼
AAC是目前比較熱門的有損壓縮編碼技術(shù),并且衍生了LC-AAC,HE-AAC,HE-AAC v2 三個主要編碼格式?
LC-ACC:比較傳統(tǒng)的AAC,主要應(yīng)用于中高碼率的場景編碼(>= 80kbit/s)
HE-AAC:主要應(yīng)用于低碼率場景(<=48Kbit/s)
特點:在小于128Kbit/s的碼率下表示優(yōu)異,多用于視頻中的音頻編碼
適用場合:于128kbit/s以下的音頻編碼,多用于視頻中的音頻軌的編碼
編碼中軟編碼和硬編碼的區(qū)別?
硬編碼:使用非CPU進(jìn)行編碼,使用使用GPU芯片處理
軟編碼:使用CPU進(jìn)行編碼計算
區(qū)分?
軟編碼:實現(xiàn)直接、簡單,參數(shù)調(diào)整方便,升級易,但CPU負(fù)載重,性能較硬編碼低,低碼率下質(zhì)量通常比硬編碼要好一點
硬編碼:性能高,低碼率下通常低于硬編碼,但部分產(chǎn)品在GPU硬件平臺移植了優(yōu)秀的軟件 編碼算法如X264,質(zhì)量基本等同于軟編碼
硬編碼,就是使用GPU計算,獲取數(shù)據(jù)結(jié)果,優(yōu)點速度快,效率高.
軟編碼,就是通過CPU來計算,獲取數(shù)據(jù)結(jié)果.