本教程操作環(huán)境:windows7系統(tǒng)、Dell G3電腦。 一、名詞解析PCM(Pulse Code Modulation)也被稱為脈碼編碼調(diào)制,PCM中的聲音數(shù)據(jù)沒有被壓縮,它是由模擬信號(hào)經(jīng)過采樣、量化、編碼轉(zhuǎn)換成的標(biāo)準(zhǔn)的數(shù)字音頻數(shù)據(jù)。采樣轉(zhuǎn)換方式參考下圖進(jìn)行了解: 音頻采樣包含以下幾大要素: 1. 采樣率采樣率表示音頻信號(hào)每秒的數(shù)字快照數(shù)。該速率決定了音頻文件的頻率范圍。采樣率越高,數(shù)字波形的形狀越接近原始模擬波形。低采樣率會(huì)限制可錄制的頻率范圍,這可導(dǎo)致錄音表現(xiàn)原始聲音的效果不佳。根據(jù)奈奎斯特采樣定理,為了重現(xiàn)給定頻率,采樣率必須至少是該頻率的兩倍。例如,一般CD唱片的采樣率為每秒 44,100 個(gè)采樣,因此可重現(xiàn)最高為 22,050 Hz 的頻率,此頻率剛好超過人類的聽力極限 20,000 Hz。
圖中A是低采樣率的音頻信號(hào),其效果已經(jīng)將原始聲波進(jìn)行了扭曲,B則是完全重現(xiàn)原始聲波的高采樣率的音頻信號(hào)。 數(shù)字音頻常用的采樣率如下: 2. 位深度位深度決定動(dòng)態(tài)范圍。采樣聲波時(shí),為每個(gè)采樣指定最接近原始聲波振幅的振幅值。較高的位深度可提供更多可能的振幅值,產(chǎn)生更大的動(dòng)態(tài)范圍、更低的噪聲基準(zhǔn)和更高的保真度。 位深度越高,提供的動(dòng)態(tài)范圍越大。 二、PCM在上面的名詞解析中我們應(yīng)該對PCM有了一定的理解和認(rèn)識(shí),下面我們將對PCM做更多的講解。 PCM文件具有流媒體特性,是數(shù)字通信的編碼方式之一。 PCM文件被廣泛用于素材保存及音樂欣賞,CD、DVD以及我們常見的 WAV文件中均有應(yīng)用,PCM文件能夠一邊讀一邊播放,而不需要把這個(gè)文件全部讀出后然后回放,這樣就可以做到不用下載 就可以實(shí)現(xiàn)收聽了。 1. PCM音頻數(shù)據(jù)存儲(chǔ)方式如果是單聲道的文件,采樣數(shù)據(jù)按時(shí)間的先后順序依次存入。如果是單聲道的音頻文件,采樣數(shù)據(jù)按時(shí)間的先后順序依次存入(也可能采用 LRLRLR 方式存儲(chǔ),只是另一個(gè)聲道的數(shù)據(jù)為 0)。 如果是雙聲道的話通常按照 LRLRLR 的方式存儲(chǔ),存儲(chǔ)的時(shí)候還和機(jī)器的大小端有關(guān)。 PCM的存儲(chǔ)方式為小端模式,存儲(chǔ)Data數(shù)據(jù)排列如下圖所示: 2. PCM 音頻數(shù)據(jù)的參數(shù)描述 PCM 音頻數(shù)據(jù)的參數(shù)的時(shí)候有如下描述方式:
44100Hz 指的是采樣率,它的意思是每秒取樣 44100 次。采樣率越大,存儲(chǔ)數(shù)字音頻所占的空間就越大。 16bit 指的是采樣精度,意思是原始模擬信號(hào)被采樣后,每一個(gè)采樣點(diǎn)在計(jì)算機(jī)中用 16 位(兩個(gè)字節(jié))來表示。采樣精度越高越能精細(xì)地表示模擬信號(hào)的差異。 Stereo 指的是聲道數(shù),也即采樣時(shí)用到的麥克風(fēng)的數(shù)量,麥克風(fēng)越多就越能還原真實(shí)的采樣環(huán)境(當(dāng)然麥克風(fēng)的放置位置也是有規(guī)定的)。 3. PCM文件格式簡介PCM文件:模擬音頻信號(hào)經(jīng)模數(shù)轉(zhuǎn)換(A/D變換)直接形成的二進(jìn)制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。Windows的Convert工具可以把PCM音頻格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。 將音頻數(shù)字化,其實(shí)就是將聲音數(shù)字化。最常見的方式是透過脈沖編碼調(diào)制PCM(Pulse Code Modulation) 。運(yùn)作原理如下:首先我們考慮聲音經(jīng)過麥克風(fēng),轉(zhuǎn)換成一連串電壓變化的信號(hào),如下圖所示。這張圖的橫座標(biāo)為秒,縱座標(biāo)為電壓大小。要將這樣的信號(hào)轉(zhuǎn)為 PCM 格式的方法,是使用三個(gè)參數(shù)來表示聲音,它們是:聲道數(shù)、采樣位數(shù)和采樣頻率。
下面再用圖解來看看采樣位數(shù)和采樣頻率的概念。讓我們來看看這幾幅圖。圖中的黑色曲線表示的是PCM 文件錄制的自然界的聲波,紅色曲線表示的是PCM 文件輸出的聲波,橫坐標(biāo)便是采樣頻率;縱坐標(biāo)便是采樣位數(shù)。這幾幅圖中的格子從左到右,逐漸加密,先是加大橫坐標(biāo)的密度,然后加大縱坐標(biāo)的密度。顯然,當(dāng)橫坐標(biāo)的單位越小即兩個(gè)采樣時(shí)刻的間隔越小,則越有利于保持原始聲音的真實(shí)情況,換句話說,采樣的頻率越大則音質(zhì)越有保證;同理,當(dāng)縱坐標(biāo)的單位越小則越有利于音質(zhì)的提高,即采樣的位數(shù)越大越好。 在計(jì)算機(jī)中采樣位數(shù)一般有8位和16位之分,但有一點(diǎn)請大家注意,8位不是說把縱坐標(biāo)分成8份,而是分成2的8次方即256份; 同理16位是把縱坐標(biāo)分成2的16次方65536份; 而采樣頻率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三種。 那么,現(xiàn)在我們就可以得到PCM文件所占容量的公式:存儲(chǔ)量 = (采樣頻率*采樣位數(shù)*聲道)*時(shí)間/8(單位:字節(jié)數(shù)). 例如,數(shù)字激光唱盤(CD-DA,紅皮書標(biāo)準(zhǔn))的標(biāo)準(zhǔn)采樣頻率為44.lkHz,采樣數(shù)位為16位,立體聲(2聲道),可以幾乎無失真地播出頻率高達(dá)22kHz的聲音,這也是人類所能聽到的最高頻率聲音。激光唱盤一分鐘音樂需要的存儲(chǔ)量為:
這個(gè)數(shù)值就是PCM聲音文件在硬盤中所占磁盤空間的存儲(chǔ)量。 計(jì)算機(jī)音頻文件的格式?jīng)Q定了其聲音的品質(zhì),日常生活中電話、收音機(jī)等均為模擬音頻信號(hào),即不存在采樣頻率和采樣位數(shù)的概念,我們可以這樣比較一下:
微軟的WAV文件就是PCM編碼的一種。 擴(kuò)展知識(shí):與PCM文件相關(guān)的其他文件類型
更多相關(guān)知識(shí),請?jiān)L問常見問題欄目! 以上就是pcm是什么文件的詳細(xì)內(nèi)容,更多請關(guān)注php中文網(wǎng)其它相關(guān)文章! |
|