本文的目的是针对MP3机上使用的数码音频格式而撰写的,所以,在播放格式上我只介绍目前MP3上常用的两种格式:MP3与WMA。如果从数码音频格式的角度来说,除了提到的这两个格式外,还有很多其他的格式:RA、MIDI、VQF、ATRAC、ATRAC3、Vorbis、AIF/AIFF、MP3PRO、Ogg、Dolby®Pro Logic®、Dolby Digital 5.1、Qdesign QDX、ATRAC3、VoiceAge等等。
1.音频格式
数字化音频格式的出现,是为了满足复制、存储、传输的需求。简单的说,早期的模拟音频格式,存在着复制失真和因为介质磨损而失效的问题。从CD盘的存储开始,数字格式音频文件开始普及,但又产生了一个问题——存储体积上的限制,同时CD盘仍然存在磨损的现象,如果保存到硬盘上(相对存储时间更长),在当时存储介质(主要是硬盘)仍然昂贵的情况下,也不是好的解决方法。而互联网的出现,更产生了远距离传输文件的要求,在带宽的制约下,缩小文件体积的需求变得更加强烈,这些都从外部因素上导致了有损压缩数字音频格式产生!
而从内部因素来说,随着电脑运算、编码能力的提高、各种声学心理模式的进步,促进了各种有损压缩数字音频格式的层出不穷。如果光从历史及现在曾经涌现出的编码格式来看,应该会列举出很多,而在MP3机上使用的音频格式,我们向大家介绍的主要有如下几种——MP3(CBR、VBR、ABR)、WMA、ADPCM。
(1)MP3(CBR、VBR、ABR)
MP3应该算目前使用用户最多的有损压缩数字音频格式了。它的全称是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德国夫朗和费研究院和法国汤姆生公司合作发展成功。刚出现时它的编码技术并不完善,它更像一个编码标准框架,留待人们去完善。早期的MP3编码采用的的是固定编码率的方式(CBR ),我们常看到的128KBPS,就是代表它是以128KBPS固定数据速率编码——你可以提高这个编码率,最高可以到320KBPS,音质会更好,自然,文件的体积会相应增大。
因为MP3的编码方式是开放的,你可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理,所以,很快由Xing公司推出可变编码率的压缩方式(VBR)。它的原理就是利用将一首歌的复杂部分用高 bitrate 编码,简单部分用低 bitrate 编码,通过这种方式,进一步取得质量和体积的统一。当然,早期的Xing 编码器的 VBR 算法很差,音质与 CBR (固定码率)相去甚远。但是,这种算法指明了一种方向,其他开发者纷纷推出自己的VBR算法,使得效果一直在改进。目前公认比较好的首推 LAME,它完美地实现了 VBR 算法,而且它是是完全免费的软件,并且由爱好者组成的开发团队一直在不断的发展完善。
而在VBR的基础上,LAME更加发展出ABR算法。ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
(2)WMA
WMA是Windows Media Audio的缩写,是微软力推的数字音乐格式。微软官方宣布的资料中称WMA格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相当的版权保护能力。应该说,WMA的推出,就是针对MP3没有版权限制的缺点而来——普通用户可能很欢迎这种格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的WMA则照顾到了这些唱片公司的需求,可以预见,唱片业可能将全力支持WMA标准。
除了版权保护外,WMA还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当然,只在MP3低于192KBPS码率的情况下有效,实际上当采用LAME算法压缩MP3格式时,高于192KBPS时普遍的反映是MP3的音质要好于WMA)。
不管怎么说,微软想介入的领域,它总能凭着自己的强大实力和在软件上的垄断地位,获得它想要的东西(尽管技术上它并不总是最出色)——这场战争应该是微软在数码音频格式领域的另一个IE与Netscape的战争版本。