自然界中的聲音非常復(fù)雜,波形極其復(fù)雜,通常我們采用的是脈沖代碼調(diào)制編碼,即PCM編碼。PCM通過(guò)抽樣、量化、編碼三個(gè)步驟將連續(xù)變化的模擬信號(hào)轉(zhuǎn)換為數(shù)字編碼。
1、什么是采樣率和采樣大?。ㄎ?bit)?
聲音其實(shí)是一種能量波,因此也有頻率和振幅的特征,頻率對(duì)應(yīng)于時(shí)間軸線(xiàn),振幅對(duì)應(yīng)于電平軸線(xiàn)。波是無(wú)限光滑的,弦線(xiàn)可以看成由無(wú)數(shù)點(diǎn)組成,由于存儲(chǔ)空間是相對(duì)有限的,數(shù)字編碼過(guò)程中,必須對(duì)弦線(xiàn)的點(diǎn)進(jìn)行采樣。采樣的過(guò)程就是抽取某點(diǎn)的頻率值,很顯然,在一秒中內(nèi)抽取的點(diǎn)越多,獲取得頻率信息更豐富,為了復(fù)原波形,一次振動(dòng)中,必須有2個(gè)點(diǎn)的采樣,人耳能夠感覺(jué)到的最高頻率為20kHz,因此要滿(mǎn)足人耳的聽(tīng)覺(jué)要求,則需要至少每秒進(jìn)行40k次采樣,用40kHz表達(dá),這個(gè)40kHz就是采樣率。我們常見(jiàn)的CD,采樣率為44.1kHz。光有頻率信息是不夠的,我們還必須獲得該頻率的能量值并量化,用于表示信號(hào)強(qiáng)度。量化電平數(shù)為2的整數(shù)次冪,我們常見(jiàn)的CD位16bit的采樣大小,即2的16次方。采樣大小相對(duì)采樣率更難理解,因?yàn)橐@得抽象點(diǎn),舉個(gè)簡(jiǎn)單例子:假設(shè)對(duì)一個(gè)波進(jìn)行8次采樣,采樣點(diǎn)分別對(duì)應(yīng)的能量值分別為A1-A8,但我們只使用2bit的采樣大小,結(jié)果我們只能保留A1-A8中4個(gè)點(diǎn)的值而舍棄另外4個(gè)。如果我們進(jìn)行3bit的采樣大小,則剛好記錄下8個(gè)點(diǎn)的所有信息。采樣率和采樣大小的值越大,記錄的波形更接近原始信號(hào)。
2、有損和無(wú)損
根據(jù)采樣率和采樣大小可以得知,相對(duì)自然界的信號(hào),音頻編碼最多只能做到無(wú)限接近,至少目前的技術(shù)只能這樣了,相對(duì)自然界的信號(hào),任何數(shù)字音頻編碼方案都是有損的,因?yàn)闊o(wú)法完全還原。在計(jì)算機(jī)應(yīng)用中,能夠達(dá)到最高保真水平的就是PCM編碼,被廣泛用于素材保存及音樂(lè)欣賞,CD、DVD以及我們常見(jiàn)的WAV文件中均有應(yīng)用。因此,PCM約定俗成了無(wú)損編碼,因?yàn)镻CM代表了數(shù)字音頻中最佳的保真水準(zhǔn),并不意味著PCM就能夠確保信號(hào)絕對(duì)保真,PCM也只能做到最大程度的無(wú)限接近。我們而習(xí)慣性的把MP3列入有損音頻編碼范疇,是相對(duì)PCM編碼的。強(qiáng)調(diào)編碼的相對(duì)性的有損和無(wú)損,是為了告訴大家,要做到真正的無(wú)損是困難的,就像用數(shù)字去表達(dá)圓周率,不管精度多高,也只是無(wú)限接近,而不是真正等于圓周率的值。
3、為什么要使用音頻壓縮技術(shù)
要算一個(gè)PCM音頻流的碼率是一件很輕松的事情,采樣率值×采樣大小值×聲道數(shù) bps。一個(gè)采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的WAV文件,它的數(shù)據(jù)速率則為 44.1K×16×2 =1411.2 Kbps。我們常說(shuō)128K的MP3,對(duì)應(yīng)的WAV的參數(shù),就是這個(gè)1411.2 Kbps,這個(gè)參數(shù)也被稱(chēng)為數(shù)據(jù)帶寬,它和ADSL中的帶寬是一個(gè)概念。將碼率除以8,就可以得到這個(gè)WAV的數(shù)據(jù)速率,即176.4KB/s。這表示存儲(chǔ)一秒鐘采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的音頻信號(hào),需要176.4KB的空間,1分鐘則約為10.34M,這對(duì)大部分用戶(hù)是不可接受的,尤其是喜歡在電腦上聽(tīng)音樂(lè)的朋友,要降低磁盤(pán)占用,只有2種方法,降低采樣指標(biāo)或者壓縮。降低指標(biāo)是不可取的,因此專(zhuān)家們研發(fā)了各種壓縮方案。由于用途和針對(duì)的目標(biāo)市場(chǎng)不一樣,各種音頻壓縮編碼所達(dá)到的音質(zhì)和壓縮比都不一樣,在后面的文章中我們都會(huì)一一提到。有一點(diǎn)是可以肯定的,他們都?jí)嚎s過(guò)。
4、頻率與采樣率的關(guān)系
采樣率表示了每秒對(duì)原始信號(hào)采樣的次數(shù),我們常見(jiàn)到的音頻文件采樣率多為44.1KHz,這意味著什么呢?假設(shè)我們有2段正弦波信號(hào),分別為20Hz和20KHz,長(zhǎng)度均為一秒鐘,以對(duì)應(yīng)我們能聽(tīng)到的最低頻和最高頻,分別對(duì)這兩段信號(hào)進(jìn)行40KHz的采樣,我們可以得到一個(gè)什么樣的結(jié)果呢?結(jié)果是:20Hz的信號(hào)每次振動(dòng)被采樣了40K/20=2000次,而20K的信號(hào)每次振動(dòng)只有2次采樣。顯然,在相同的采樣率下,記錄低頻的信息遠(yuǎn)比高頻的詳細(xì)。這也是為什么有些音響發(fā)燒友指責(zé)CD有數(shù)碼聲不夠真實(shí)的原因,CD的44.1KHz采樣也無(wú)法保證高頻信號(hào)被較好記錄。要較好的記錄高頻信號(hào),看來(lái)需要更高的采樣率,于是有些朋友在捕捉CD音軌的時(shí)候使用48KHz的采樣率,這是不可取的!這其實(shí)對(duì)音質(zhì)沒(méi)有任何好處,對(duì)抓軌軟件來(lái)說(shuō),保持和CD提供的44.1KHz一樣的采樣率才是最佳音質(zhì)的保證之一,而不是去提高它。較高的采樣率只有相對(duì)模擬信號(hào)的時(shí)候才有用,如果被采樣的信號(hào)是數(shù)字的,請(qǐng)不要去嘗試提高采樣率。
5、流特征
隨著網(wǎng)絡(luò)的發(fā)展,人們對(duì)在線(xiàn)收聽(tīng)音樂(lè)提出了要求,因此也要求音頻文件能夠一邊讀一邊播放,而不需要把這個(gè)文件全部讀出后然后回放,這樣就可以做到不用就可以實(shí)現(xiàn)收聽(tīng)了。也可以做到一邊編碼一邊播放,正是這種特征,可以實(shí)現(xiàn)在線(xiàn)的直播,架設(shè)自己的數(shù)字廣播電臺(tái)成為了現(xiàn)實(shí)。