技術 > 音頻格式
目錄
No. 1
  以下是常見音頻文件格式的特點。
  要在計算機內播放或是處理音頻文件,也就是要對聲音文件進行數、模轉換,這個過程同樣由采樣和量化構成,人耳所能聽到的聲音,最低的頻率是從20hz起一直到最高頻率20khz,20khz以上人耳是聽不到的,因此音頻的最大帶寬是20khz,故而采樣速率需要介於40~50khz之間,而且對每個樣本需要更多的量化比特數。音頻數字化的標準是每個樣本16位-96db的信噪比,采用綫性脈衝編碼調製pcm,每一量化步長都具有相等的長度。在音頻文件的製作中,正是采用這一標準。
cd格式:天簌
  當今世界上音質最好的音頻格式是什麽?當然是cd了。因此要講音頻格式,cd自然是打頭陣的先鋒。在大多數播放軟件的“打開文件類型”中,都可以看到*.cda格式,這就是cd音軌了。標準cd格式也就是44.1k的采樣頻率,速率88k/秒,16位量化位數,因為cd音軌可以說是近似無損的,因此它的聲音基本上是忠於原聲的,因此如果你如果是一個音響發燒友的話,cd是你的首選。它會讓你感受到天籟之音。cd光盤可以在cd唱機中播放,也能用電腦裏的各種播放軟件來重放。一個cd音頻文件是一個*.cda文件,這衹是一個索引信息,並不是真正的包含聲音信息,所以不論cd音樂的長短,在電腦上看到的“*.cda文件”都是44字節長。註意:不能直接的復製cd格式的*.cda文件到硬盤上播放,需要使用象eac這樣的抓音軌軟件把cd格式的文件轉換成wav,這個轉換過程如果光盤驅動器質量過關而且eac的參數設置得當的話,可以說是基本上無損抓音頻。推薦大傢使用這種方法。
wav:無損
  是微軟公司開發的一種聲音文件格式,它符合 piffresource interchange file format 文件規範,用於保存windows平臺的音頻信息資源,被windows平臺及其應用程序所支持。“*.wav”格式支持msadpcm、ccitt a law等多種壓縮算法,支持多種音頻位數、采樣頻率和聲道,標準格式的wav文件和cd格式一樣,也是44.1k的采樣頻率,速率88k/秒,16位量化位數,看到了吧,wav格式的聲音文件質量和cd相差無幾,也是目前pc機上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都“認識”wav格式。
  這裏順便提一下由蘋果公司開發的aiff(audio interchange file format)格式和為unix係統開發的au格式,它們都和和wav非常相像,在大多數的音頻編輯軟件中也都支持它們這幾種常見的音樂格式。
mp3:流行
  mp3格式誕生於八十年代的德國,所謂的mp3也就是指的是mpeg標準中的音頻部分,也就是mpeg音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應“*.mp1"/“*.mp2”/“*.mp3”這3種聲音文件。需要提醒大傢註意的地方是:mpeg音頻文件的壓縮是一種有損壓縮,mpeg3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12khz到16khz高音頻這部分的質量來換取文件的尺寸,相同長度的音樂文件,用*.mp3格式來儲存,一般衹有*.wav文件的1/10,而音質要次於cd格式或wav格式的聲音文件。由於其文件尺寸小,音質好;所以在它問世之初還沒有什麽別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是風靡一時,作為主流音頻格式的地位難以被撼動。但是樹大招風,mp3音樂的版權問題也一直是找不到辦法解决,因為mp3沒有版權保護技術,說白了也就是誰都可以用。
  mp3格式壓縮音樂的采樣頻率有很多種,可以用64kbps或更低的采樣頻率節省空間,也可以用320kbps的標準達到極高的音質。我們用裝有fraunhofer iis mpeg lyaer3的 mp3編碼器(現在效果最好的編碼器)musicmatch jukebox 6.0在128kbps的頻率下編碼一首3分鐘的歌麯,得到2.82mb的mp3文件。采用缺省的cbr(固定采樣頻率)技術可以以固定的頻率采樣一首歌麯,而vbr(可變采樣頻率)則可以在音樂“忙”的時候加大采樣的頻率獲取更高的音質,不過産生的mp3文件可能在某些播放器上無法播放。我們把vbr的級別設定成為與前面的cbr文件的音質基本一樣,生成的vbr mp3文件為2.9mb。
midi:作麯傢最愛
  經常玩音樂的人應該常聽到midi(musical instrument digital interface)這個詞,midi允許數字合成器和其他設備交換數據。mid文件格式由midi繼承而來。mid文件並不是一段錄製好的聲音,而是記錄聲音的信息,然後在告訴聲卡如何再現音樂的一組指令。這樣一個midi文件每存1分鐘的音樂衹用大約5~10kb。今天,mid文件主要用於原始樂器作品,流行歌麯的業餘表演,遊戲音軌以及電子賀卡等。*.mid文件重放的效果完全依賴聲卡的檔次。*.mid格式的最大用處是在電腦作麯領域。*.mid文件可以用作麯軟件寫出,也可以通過聲卡的midi口把外接音序器演奏的樂麯輸入電腦裏,製成*.mid文件。
wma:最具實力
  wma (windows media audio) 格式是來自於微軟的重量級選手,後臺強硬,音質要強於mp3格式,更遠勝於ra格式,它和日本yamaha公司開發的vqf格式一樣,是以減少數據流量但保持音質的方法來達到比mp3壓縮率更高的目的,wma的壓縮率一般都可以達到1:18左右,wma的另一個優點是內容提供商可以通過drm(digital rights management)方案如windows media rights manager 7加入防拷貝保護。這種內置了版權保護技術可以限製播放時間和播放次數甚至於播放的機器等等,這對被盜版攪得焦頭亂額的音樂公司來說可是一個福音,另外wma還支持音頻流(stream)技術,適合在網絡上在綫播放,作為微軟搶占網絡音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象mp3那樣需要安裝額外的播放器,而windows操作係統和windows media player的無縫捆綁讓你衹要安裝了windows操作係統就可以直接播放wma音樂,新版本的windows media player7.0更是增加了直接把cd光盤轉換為wma聲音格式的功能,在新出品的操作係統windows xp中,wma是默認的編碼格式,大傢知道netscape的遭遇,現在“狼”又來了。wma這種格式在錄製時可以對音質進行調節。同一格式,音質好的可與cd媲美,壓縮率較高的可用於網絡廣播。雖然現在網絡上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網絡音樂領域中直逼*.mp3,在網絡廣播方面,也正在瓜分real打下的天下。因此,幾乎所有的音頻格式都感受到了wma格式的壓力。
realaudio:流動旋律
  realaudio主要適用於在網絡上的在綫音樂欣賞,現在大多數的用戶仍然在使用56kbps或更低速率的modem,所以典型的回放並非最好的音質。有的下載站點會提示你根據你的modem速率選擇最佳的real文件。現在real的的文件格式主要有這麽幾種:有ra(realaudio)、rm(realmedia,realaudio g2)、rmx(realaudio secured),還有更多。這些格式的特點是可以隨網絡帶寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令帶寬較富裕的聽衆獲得較好的音質。
  近來隨着網絡帶寬的普遍改善,real公司正推出用於網絡廣播的、達到cd音質的格式。如果你的realplayer軟件不能處理這種格式,它就會提醒你下載一個免費的升級包。
vqf:無人問津
  vqf是 雅馬哈公司開發的一種格式是,它的核心是減少數據流量但保持音質的方法來達到更高的壓縮比,可以說技術上也是很先進的,但是由於宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時雅馬哈也提供從*.wav文件轉換到*.vqf文件的軟件。 此文件缺少特點外加缺乏宣傳,現在幾乎已經宣佈死刑了。
ogg:新生代音頻格式
  ogg全稱應該是ogg vobis(ogg vorbis) 是一種新的音頻壓縮格式,類似於mp3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限製的。ogg vobis有一個很出衆的特點,就是支持多聲道,隨着它的流行,以後用隨身聽來聽dts編碼的多聲道作品將不會是夢想。
  vorbis 是這種音頻壓縮機製的名字,而ogg則是一個計劃的名字,該計劃意圖設計一個完全開放性的多媒體係統。目前該計劃衹實現了oggvorbis這一部分。
  ogg vorbis文件的擴展名是.ogg。這種文件的設計格式是非常先進的。現在創建的ogg文件可以在未來的任何播放器上播放,因此,這種文件格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器。
  ogg格式完全開源,完全免費, 和mp3不相上下的新格式。
aac: 前途無量
  aac(高級音頻編碼技術 advanced audio coding),是杜比實驗室為音樂提供的技術,最大能容納48通道的音軌,采樣率達96 khz。出現於1997年,是基於mpeg-2的音頻編碼技術。由fraunhofer iis、杜比、蘋果、at&t、索尼等公司共同開發,以取代mp3格式。2000年,mpeg-4標準出臺,aac從新整合了其特性,故現又稱mpeg-4 aac,即m4a。
  aac作為一種高壓縮比的音頻壓縮算法,aac通常壓縮比為18:1,也有資料說為20:1,遠遠超過了ac-3、mp3等較老的音頻壓縮算法。一般認為,aac格式在96kbps碼率的表現超過了128kbps的mp3音頻。aac另一個引人註目的地方就是它的多聲道特性,它支持1~48個全音域音軌和15個低頻音軌。除此之外,aac最高支持96khz的采樣率,其解析能力足可以和dvd-audio的pcm編碼相提並論,因此,它得到了dvd論壇的支持,成為了下一代dvd的標準音頻編碼。
總結
  時下的mp3支持格式最常見的是mp3和wma。mp3由於是有損壓縮,因此講求采樣率,一般是44.1khz。另外,還有比特率,即數據流,一般為8---320kbps。在mp3編碼時,還看看它是否支持可變比特率(vbr),現在出的mp3機大部分都支持,這樣可以減小有效文件的體積。wma則是微軟力推的一種音頻格式,相對來說要比mp3體積更小。
WAV:無損
  是微軟公司開發的一種聲音文件格式,它符合 PIFFResource Interchange File Format 文件規範,用於保存WINDOWS平臺的音頻信息資源,被WINDOWS平臺及其應用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多種壓縮算法,支持多種音頻位數、采樣頻率和聲道,標準格式的WAV文件和CD格式一樣,也是44.1K的采樣頻率,速率88K/秒,16位量化位數,看到了吧,WAV格式的聲音文件質量和CD相差無幾,也是目前PC機上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都“認識”WAV格式。 但缺點是體型過於“巨大”。
AIFF與AU
  這裏順便提一下由蘋果公司開發的AIFF(Audio Interchange File Format)格式和為UNIX係統開發的AU格式,它們都和WAV非常相像,在大多數的音頻編輯軟件中也都支持它們這幾種常見的音樂格式。
MP3:流行
  MP3格式誕生於八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應“*.mp1"/“*.mp2”/“*.mp3”這3種聲音文件。需要提醒大傢註意的地方是:MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質量來換取文件的尺寸,相同長度的音樂文件,用*.mp3格式來儲存,一般衹有*.wav文件的1/10,而音質要次於CD格式或WAV格式的聲音文件。由於其文件尺寸小,音質好;所以在它問世之初還沒有什麽別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是風靡一時,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的版權問題也一直是找不到辦法解决,因為MP3沒有版權保護技術,說白了也就是誰都可以用。
  MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節省空間,也可以用320Kbps的標準達到極高的音質。我們用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鐘的歌麯,得到2.82MB的MP3文件。采用缺省的CBR(固定采樣頻率)技術可以以固定的頻率采樣一首歌麯,而VBR(可變采樣頻率)則可以在音樂“忙”的時候加大采樣的頻率獲取更高的音質,不過産生的MP3文件可能在某些播放器上無法播放。我們把VBR的級別設定成為與前面的CBR文件的音質基本一樣,生成的VBR MP3文件為2.9MB。
WMA:最具實力
  WMA (Windows Media Audio) 格式是來自於微軟的重量級選手,後臺強硬,音質要強於MP3格式,更遠勝於RA格式,它和日本YAMAHA公司開發的VQF格式一樣,是以減少數據流量但保持音質的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達到1:18左右,WMA的另一個優點是內容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。這種內置了版權保護技術可以限製播放時間和播放次數甚至於播放的機器等等,這對被盜版攪得焦頭亂額的音樂公司來說可是一個福音,另外WMA還支持音頻流(Stream)技術,適合在網絡上在綫播放,作為微軟搶占網絡音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作係統和Windows Media Player的無縫捆綁讓你衹要安裝了windows操作係統就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光盤轉換為WMA聲音格式的功能,在新出品的操作係統Windows XP中,WMA是默認的編碼格式,大傢知道Netscape的遭遇,現在“狼”又來了。WMA這種格式在錄製時可以對音質進行調節。同一格式,音質好的可與CD媲美,壓縮率較高的可用於網絡廣播。雖然現在網絡上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網絡音樂領域中直逼*.mp3,在網絡廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。
  時下的MP3支持格式最常見的是MP3和WMA。MP3由於是有損壓縮,因此講求采樣率,一般是44.1KHZ。另外,還有比特率,即數據流,一般為8---320KBPS。在MP3編碼時,還看看它是否支持可變比特率(VBR),現在出的MP3機大部分都支持,這樣可以減小有效文件的體積。WMA則是微軟力推的一種音頻格式,相對來說要比MP3體積更小。
AAC: 前途無量
  AAC(高級音頻編碼技術 Advanced Audio Coding),是杜比實驗室為音樂提供的技術,最大能容納48通道的音軌,采樣率達96 KHz。出現於1997年,是基於MPEG-2的音頻編碼技術。由Fraunhofer IIS、杜比、蘋果、AT&T、索尼等公司共同開發,以取代mp3格式。2000年,MPEG-4標準出臺,AAC從新整合了其特性,故現又稱MPEG-4 AAC,即m4a。
  AAC作為一種高壓縮比的音頻壓縮算法,AAC通常壓縮比為18:1,也有資料說為20:1,遠遠超過了AC-3、MP3等較老的音頻壓縮算法。一般認為,AAC格式在96Kbps碼率的表現超過了128Kbps的MP3音頻。AAC另一個引人註目的地方就是它的多聲道特性,它支持1~48個全音域音軌和15個低頻音軌。除此之外,AAC最高支持96KHz的采樣率,其解析能力足可以和DVD-Audio的PCM編碼相提並論,因此,它得到了DVD論壇的支持,成為了下一代DVD的標準音頻編碼。
無損壓縮格式
  APE格式
  新一代的無損音頻格式。 APE的本質,其實它是一種無損壓縮音頻格式。龐大的WAV音頻文件可以通過Monkey''s Audio這個軟件進行“瘦身”壓縮為APE。很時候它被用做網絡音頻文件傳輸,因為被壓縮後的APE文件容量要比WAV源文件小一半多,可以節約傳輸所用的時間。更重要的是,通過Monkey's Audio解壓縮還原以後得到的WAV文件可以做到與壓縮前的源文件完全一致。所以APE被譽為“無損音頻壓縮格式”,Monkey''s Audio被譽為“無損音頻壓縮軟件”。
  FLAC格式
  非常成熟的無損壓縮格式,名氣不在APE之下!FLAC是FreeLosslessAudioCodec的簡稱,該格式的源碼完全開放,而且兼容幾乎所有的操作係統平臺。它的編碼算法相當成熟,已經通過了嚴格的測試,而且據說在文件點損壞的情況下依然能夠正常播放(這一點我不曾試過)。該格式不僅有成熟的Windows製作程序,還得到了衆多第三方軟件的支持。此外該格式是唯一的已經得到硬件支持的無損格式,Rio公司的硬盤隨身聽Karma,建伍的車載音響MusicKeg以及PhatBox公司的數碼播放機都能支持FLAC格式。
  TAK格式(Tom's Audio Kompressor)
  TAK是一種新型的無損音頻壓縮格式,全稱是Tom's Audio Kompressor,産於德國。目前最新版本還停留在1.01(2007年06月02日)。它類似於FLAC和APE,總體來說,壓縮率類似APE而且解壓縮速度類似FLAC,算是綜合了兩者的優點。另外,用此格式的編碼器壓縮的音頻是VBR,即可變比特率的。
  幾大特點:
  -較為優秀的壓縮率。使用Extra參數的壓縮率類似APE的High參數,而使用TAK最快的壓縮參數Turbo得到的結果和FLAC壓縮率最大的參數效果有得一比。
  -較快的壓縮速度。作者說在相同壓縮率的情況下,據他瞭解尚未有別的格式能夠比TAK的Turbo和Fast的參數壓縮得更快。
  -非常快的解壓速度。類似於FLAC的解壓速度。
  -支持很多常用音頻格式轉換為TAK。
  -流支持。每隔兩秒,包含解碼所需全部信息的一楨會被插入到音頻中。
  -容錯度。1比特的信息出錯,最多影響到250毫秒的音頻。由於有上文提到的技術支持,利用本格式壓縮的損壞嚴重的音頻也可照樣播放,代價是損壞的部分由靜音代替。
  -錯誤校驗。24比特的CRC校驗用於每一楨上。
  -簡單快速的查找能力。即在你需要從中間某一點播放的時候,能夠很快地找到你想要的地方開始播放,定位也十分準確。
  -支持音頻信息。同時支持利用外挂CUE分割音軌和添加音頻信息。類似APE等。
  TTA格式(True Audio)
  True Audio(縮寫TTA)是一種免費又簡單的實時無損音頻編解碼器。TTA是一種基於自適應預測過濾的無損音頻壓縮,與目前主要的其他各式相比,能有相同或更好的壓縮效果。
  可將數據壓縮至30%的無損音頻數據壓縮
  實時編碼/解碼演算法
  操作快捷、對係統要求低
  支持多平臺
  免費和開放源碼
  硬體支持
  TTA是用於對多聲道8、16、24 bits整型和32bitsIEEE浮點型的音頻WAV格式的無損壓縮,壓縮的大小範圍是原文件大小的30%—70%。TTA格式主要目標不是追求最大的壓縮率,而是對於硬體執行的編碼演算法最優化,同時支持ID3v1和ID3v2兩種標簽信息。
  使用True Audio編碼,您可以將20張收藏的音頻CD存儲到一張DVD-R盤上並播放。還能用流行的ID3標簽存儲所有麯目的信息。
  WV格式(WavPack)
  一種相當有特點的音頻壓縮格式,WavPack不僅僅是一個無損壓縮格式,它還能同時作為有損壓縮格式。在其獨特的“hybrid”模式下,WavPack可以壓縮成wv文件(有損壓縮格式,大小一般相當於WAV文件的23%左右)+wvc文件(修正文件,大小一般相當於WAV文件的41%左右)的組合。有了對應的wvc文件,有損壓縮格式的wv文件就變成了無損格式,播放時和普通的無損壓縮格式完全一樣。如果為了減少文件體積,你可以去掉這個wvc文件,這時wv文件就變成有損格式了,播放起來和高比特率的MP3完全一樣!WavPack同時包容了無損格式和有損格式,神奇吧?通過WavPackFrontend前臺程序,我們可以方便地使用WavPack格式。
  WavPack是目前主流的無損壓縮格式之一,編碼速度和算法都相較APE要好。
  WV 優點
  * Open source (開放源碼)
  * Very fast decoding (快速解碼)
  * Good efficiency (高壓縮率)
  * Error robustness (容錯)
  * Streaming support (支持流媒體)
  * Hardware support (RockBox) (硬件支持)
  * Supports multichannel audio and high resolutions (多聲道)
  * Hybrid/lossy mode (有損/無損模式)
  * Tagging support (ID3v1, APE tags) (D3v1、APE標簽支援)
  * Supports RIFF chunks (支持RFF)
  * Ability to create self extracting files for Win32 platform(win32係統支持産生自解壓檔案)
  * Pipe support
  * Good software support (相當不錯的軟件支持)
  * ReplayGain compatible
  WV Other features (其它功能)
  * Supports 32bit float streams (支持32bit浮動串流)
  * Supports embedded CUE sheets (支持cue清單)
  * Includes MD5 hashes for quick integrity checking (支持MD5校驗)
  * Can encode in both symmetrical and assymmetrical modes(對稱與不對稱模式均可編碼)
  * Fits the Matroska container (可放入Matroska外殼,也就是MKV)
評論
  作為數字音樂文件格式的標準, WAV 格式容量過大,因而使用起來很不方便。因此,一般情況下我們把它壓縮為MP3或 WMA 格式。壓縮方法有無損壓縮,有損壓縮,以及混成壓縮。MPEG, JPEG就屬於混成壓縮,如果把壓縮的數據還原回去,數據其實是不一樣的。當然,人耳是無法分辨的。因此,如果把 MP3, OGG格式從壓縮的狀態還原回去的話,就會産生損失。然而, APE 格式即使還原,也能毫無損失地保留原有音質。所以, APE可以無損失高音質地壓縮和還原。在完全保持音質的前提下,APE的壓縮容量有了適當的減小。拿一個最為常見的38MB WAV文件為例,壓縮為 APE 格式後為25MB 左右,比開始足足少了13MB。而且MP3容量越來越大的今天,25M的歌麯已經算不上什麽龐然大物了。以1GB的mp3來說可以放入4張CD,那就是40多首歌麯,已經足夠了!
相關詞
計算機匯編語言視頻格式編碼技術微軟mp3中國武術職業聯賽音樂
公司名稱財經知識技術通訊單片機電子技術音頻文件格式
岩土工程壓縮格式編碼音樂遊戲核心破解手機電子數碼
聲音手機術語文件m3u更多結果...
包含詞
新生代音頻格式aac音頻格式SWA音頻格式
ogg:新生代音頻格式