MP3的定義及其工作原理和組成
MP3不僅僅是一種音樂格式,它同時也是能夠播放MP3音樂文件的播放器。MP3的全稱是Moving Picture Experts Group Audio Layer III,是一種較流行的數(shù)字音頻編碼和有損壓縮格式。這種壓縮方式能夠大幅度地降低音頻數(shù)據(jù)量,而對于大多數(shù)用戶來說,重放的音質與原始音頻相比沒有明顯的下降。MP3是利用MPEG Audio Layer 3的技術,將音樂以1:10甚至1:12的壓縮率進行壓縮,生成容量較小的文件。由于這種壓縮方式的特點,MP3格式幾乎成為了網(wǎng)上音樂的代名詞。
現(xiàn)在市面上有很多帶視頻功能的MP3,被人們戲稱為MP3.5。而真正的MP3和MP4之間存在明顯的區(qū)別。MP4需要達到2.4以上分辨率、320240以上的顯示屏,色彩在6W5千色以上,并且支持MP3/MP4/AVI/RM等的無轉換播放,自身存儲量不低于20G?,F(xiàn)在有些大屏幕的MP3,雖然空間只有1G-4G,但也支持存儲卡擴展,它們也被稱作MP4,這實際上是一種營銷噱頭。
MP5則是由國內(nèi)科技廠商自行研發(fā)出的一種音效文件格式和演算法,它將一首完整的wav、mp3或cda的聲音檔案,經(jīng)由MP5的壓縮技術,以大約1:10的壓縮比例產(chǎn)生音樂聲音檔案。MP5使用特殊的壓縮演算法過濾掉人類無法聽到的聲音以獲取更多儲存空間。以MP5技術壓縮后的音樂,在音質上可能比MP3稍差,但一般聽者難以察覺。
實際上,MP3、MP4和MP5這些命名只是國內(nèi)廠商的一種營銷手段,它們的實際技術特性和功能可能存在差異。真正的MP5是由德國HK公司研制的武器,如MPHK54命名為MP5(MachinePistol5)。
MP3的發(fā)展始于數(shù)字音頻廣播(DAB)項目,這個項目在德國進行并得到了歐盟資助。在研發(fā)過程中,出現(xiàn)了兩個主要的提案:Musicam和ASPEC。最終,Musicam由于其簡單性、出錯時的健壯性以及高質量壓縮時的計算效率而被選中。這個技術融合到了ISO MPEG Audio Layer I、II以及后來的Layer III(即MP3)格式的定義中。經(jīng)過一系列的研究和發(fā)展,MP3最終成為了MPEG-1標準的一部分,并成為了廣泛支持的數(shù)字音頻格式。
編碼器的壓縮效率通常是以位速來衡量的,因其壓縮率依賴于位深度(bit depth)和輸入信號的采樣頻率。在實際產(chǎn)品中,有時會使用CD參數(shù)(如44.1kHz采樣率,雙聲道,每聲道16位,即所謂的2x16位配置)作為壓縮率的參考標準。這種參考下的壓縮率往往較高,也揭示了壓縮率在有損壓縮應用中的復雜性。
Karlheinz Brandenburg通過運用CD介質中的Suzanne Vega的經(jīng)典歌曲Tom’s Diner來評估MP3壓縮算法。這首歌因其柔和、簡單的旋律,使得在回放過程中更容易識別出壓縮格式中的細微缺陷。這也使得一些人戲稱Suzanne Vega為“MP3之母”。除此之外,專業(yè)音頻工程師更傾向于使用EBU V3/SQAM參考CD中的嚴肅和critical音頻選段(如鐘琴、三角鐵、口琴等樂器)來主觀評價MPEG音頻格式的質量。
MP3編碼技術的普及離不開ISO MPEG Audio委員會成員的努力。為了生成兼容的MPEG Audio文件(Layer 1、Layer 2、Layer 3),他們使用C語言開發(fā)了一個名為ISO 11172-5的參考模擬軟件。在非實時操作系統(tǒng)上,該軟件能夠展示基于DSP的實時硬件解碼的初步形態(tài)。此后,MPEG Audio的實時應用不斷得到開發(fā),廣泛應用于數(shù)字廣播(如無線電DAB和電視DVB)的消費接收機和機頂盒。
值得一提的是,F(xiàn)raunhofer-Gesellschaft于1994年7月7日發(fā)布了首個MP3編碼器——l3enc。不久后的1995年7月14日,F(xiàn)raunhofer開發(fā)組正式確定了使用.mp3作為文件擴展名(之前使用的是.bit)。隨著第一款實時軟件MP3播放器Winplay3的發(fā)布(1995年9月9日),許多用戶得以在個人電腦上編碼和回放MP3文件。由于當時硬盤空間有限(如500MB),這項技術對于存儲娛樂音樂來說顯得尤為重要。
MP3播放器是播放MP3格式音樂的工具。MP3是MPEG Audio Layer 3的簡稱,屬于MPEG壓縮格式的一部分,該格式是由運動圖像專家組(MPEG)制定的關于影像和聲音的標準。MP3專為聲音信號壓縮而設計,采用MPEG中的第三層音頻壓縮模式,是音頻信號壓縮的一種新標準。中文常稱其為“電腦網(wǎng)絡音樂”。與MPEG的第一層和第二層編碼相比,第三層音頻壓縮模式更為復雜,但音質更高,甚至接近CD音質。傳統(tǒng)CD的采樣率為44.1MHz,16Bits,數(shù)據(jù)量為1.4Mbps,而相應的MP3數(shù)據(jù)量僅為1/12,即112kbps或128kbps。這意味著一張CD現(xiàn)在可以存儲更多倍的音樂內(nèi)容,但人耳聽到的音樂效果卻幾乎沒有差異。
MP3本身是一種計算和處理的壓縮與解壓縮方式,專門用于處理高比率的聲音信息。其生成的聲音文件音質接近CD水平,但文件大小僅為CD的十二分之一。以存儲為例,若一張光盤能存放約12-20首CD格式的音樂,若轉為MP3格式,則可存儲近100首。MP3的初衷是為了減小文件大小,便于網(wǎng)絡傳輸,同時保持與原始音樂相近的播放效果。
MP4(也稱為MPEG-4)是MPEG格式的另一種形式,主要用于活動圖像的壓縮。這種壓縮方式可以使用較小的文件提供較高的圖像質量,是目前網(wǎng)絡上最流行的視頻文件格式之一。MP4不僅適用于低頻帶,也可覆蓋高頻帶。它提供了一個更廣泛的平臺用于多媒體數(shù)據(jù)壓縮,不僅僅局限于壓縮技術本身,還包括圖像合成、語音合成等多種技術。自提出以來,MP4就引起了廣泛關注。目前,DivX和XviD是最流行的MP4壓縮方式。經(jīng)過這些技術處理的DVD節(jié)目,雖然視頻和音頻質量有所下降,但文件大小大大縮小,便于存儲和傳輸。