音频播放格式
音频播放格式是指MP4播放器支持的音频格式,一般以MP3,WMA,WAV等格式为主。
MP3应该算目前使用用户最多的有损压缩数字音频格式了。它的全称是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德国夫朗和费研究院和法国汤姆生公司合作发展成功。刚出现时它的编码技术并不完善,它更像一个编码标准框架,留待人们去完善。早期的MP3编码采用的的是固定编码率的方式(CBR ),我们常看到的128KBPS,就是代表它是以128KBPS固定数据速率编码――你可以提高这个编码率,最高可以到320KBPS,音质会更好,自然,文件的体积会相应增大。
因为MP3的编码方式是开放的,你可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理,所以,很快由Xing公司推出可变编码率的压缩方式(VBR)。它的原理就是利用将一首歌的复杂部分用高 bitrate 编码,简单部分用低 bitrate 编码,通过这种方式,进一步取得质量和体积的统一。当然,早期的Xing 编码器的 VBR 算法很差,音质与 CBR (固定码率)相去甚远。但是,这种算法指明了一种方向,其他开发者纷纷推出自己的VBR算法,使得效果一直在改进。目前公认比较好的首推 LAME,它完美地实现了 VBR 算法,而且它是是完全免费的软件,并且由爱好者组成的开发团队一直在不断的发展完善。
而在VBR的基础上,LAME更加发展出ABR算法。ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
WMA是Windows Media Audio的缩写,是微软力推的数字音乐格式。微软官方宣布的资料中称WMA格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相当的版权保护能力。应该说,WMA的推出,就是针对MP3没有版权限制的缺点而来――普通用户可能很欢迎这种格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的WMA则照顾到了这些唱片公司的需求,可以预见,唱片业可能将全力支持WMA标准。
除了版权保护外,WMA还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当然,只在MP3低于192KBPS码率的情况下有效,实际上当采用LAME算法压缩MP3格式时,高于192KBPS时普遍的反映是MP3的音质要好于WMA)。
不管怎么说,微软想介入的领域,它总能凭着自己的强大实力和在软件上的垄断地位,获得它想要的东西(尽管技术上它并不总是最出色)――这场战争应该是微软在数码音频格式领域的另一个IE与Netscape的战争版本。
小结:因为本文的目的是针对MP3机上使用的数码音频格式而撰写的,所以,在播放格式上我只介绍目前MP3上常用的两种格式:MP3与WMA。如果从数码音频格式的角度来说,除了提到的这两个格式外,还有很多其他的格式:RA、MIDI、VQF、ATRAC、ATRAC3、Vorbis、AIF/AIFF、MP3PRO、Ogg、Dolby?Pro Logic?、Dolby Digital 5.1、Qdesign QDX、ATRAC3、VoiceAge等等。
其实随着电脑运算能力的增强、声学原理认识的进步、压缩技术的发展,还会涌现出更多的数字压缩音频格式――相比前面提到的MP3、WMA,它们或者从压缩比上下工夫、或者从版权保护上下工夫(有正反的取舍,有的要,有的不要)、或者从音质上下工夫。
但是,请注意:格式的技术先进并不代表市场!一种格式的流行,乃至成为一种使用数量上的标准,除了技术因素外,还取决于其他的因素。就我个人的看法,先入为主的影响是很大的,以MP3来说,正因为目前它在用户规模上是最大的,所以尽管它的压缩比、音质、版权保护方面都存在缺点,但是用户很容易形成一种惯性――获得MP3文件越容易,越多用户加入这个行列;反过来促进越多文件采用这种格式存储――这就形成了一个正向循环,加上因为更多的播放软件支持MP3、更多的第三方开发更先进的编码算法,这些WMA是Windows Media Audio的缩写,是微软力推的数字音乐格式。微软官方宣布的资料中称WMA格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相当的版权保护能力。应该说,WMA的推出,就是针对MP3没有版权限制的缺点而来――普通用户可能很欢迎这种格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的WMA则照顾到了这些唱片公司的需求,可以预见,唱片业可能将全力支持WMA标准。
除了版权保护外,WMA还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当然,只在MP3低于192KBPS码率的情况下有效,实际上当采用LAME算法压缩MP3格式时,高于192KBPS时普遍的反映是MP3的音质要好于WMA)。
不管怎么说,微软想介入的领域,它总能凭着自己的强大实力和在软件上的垄断地位,获得它想要的东西(尽管技术上它并不总是最出色)――这场战争应该是微软在数码音频格式领域的另一个IE与Netscape的战争版本。
小结:因为本文的目的是针对MP3机上使用的数码音频格式而撰写的,所以,在播放格式上我只介绍目前MP3上常用的两种格式:MP3与WMA。如果从数码音频格式的角度来说,除了提到的这两个格式外,还有很多其他的格式:RA、MIDI、VQF、ATRAC、ATRAC3、Vorbis、AIF/AIFF、MP3PRO、Ogg、Dolby?Pro Logic?、Dolby Digital 5.1、Qdesign QDX、ATRAC3、VoiceAge等等。
其实随着电脑运算能力的增强、声学原理认识的进步、压缩技术的发展,还会涌现出更多的数字压缩音频格式――相比前面提到的MP3、WMA,它们或者从压缩比上下工夫、或者从版权保护上下工夫(有正反的取舍,有的要,有的不要)、或者从音质上下工夫。
但是,请注意:格式的技术先进并不代表市场!一种格式的流行,乃至成为一种使用数量上的标准,除了技术因素外,还取决于其他的因素。就我个人的看法,先入为主的影响是很大的,以MP3来说,正因为目前它在用户规模上是最大的,所以尽管它的压缩比、音质、版权保护方面都存在缺点,但是用户很容易形成一种惯性――获得MP3文件越容易,越多用户加入这个行列;反过来促进越多文件采用这种格式存储――这就形成了一个正向循环,加上因为更多的播放软件支持MP3、更多的第三方开发更先进的编码算法,这些都推动MP3在自身格式上的进步,又导致用户使用上的更加普及(正如我上面提到的那么多种格式,读者不说曾经使用过或了解,有些格式的名称大家是否听过都是疑问)。
所以,短期内我个人还是看好MP3格式的发展――除了上面提到的非技术因素外,随着存储介质容量和网络带宽的进一步增大,压缩比或许正变得不那么重要了(我现在敢大胆的使用高于192KBPS码率压缩自己的CD,遇到经典的,我甚至直接使用320KBPS,原因无它,我的电脑硬盘是40G,而这个配置还在逐渐落伍);版权保护也是双刃剑,对厂商而言是好事,对用户则是排斥的心理。
因此,在本章节的最后,我并不做MP3、WMA格式与其他格式的对比,仅以这两个目前在MP3机上使用最频繁的格式来做一番对比。
从压缩比角度来说,在低于192KBPS的条件下,WMA可以在同样音质条件下获得比MP3文件更小的体积――甚至一半。 所以如果你的MP3容量并不大,而且你并不追求音质的更完美(特别当你的用途是听一些英语教材、相声、评书类不要求音质、回放效果的时候),假如你的MP3机支持WMA格式的播放,那么恭喜你――你的MP3机容量可以变相的增大一倍。
反过来,如果你的MP3容量有够大(目前的主流应该是往128M发展),而且又注重音质感受,那么强烈建议你使用LAME压缩算法平均192KBPS以上码率压缩,你会发现,和你往常使用的128KBPS码率文件相比,会获得不同的感受(当然,还和MP3机的音质处理效果、耳机的选择相关)。
这些是从我个人使用中获得的感受,你可以参考。但是更重要的是自己去尝试――因为MP3机正越来越往多档次方向发展――高、中、低端的MP3日趋细分:质量、功能、价格上都如是,只有配合自己的具体机型,通过实践,才能找到适合自己的格式及编码率。
WAV文件格式是一种由微软和IBM联合开发的用于音频数字存储的标准,它采用RIFF文件格式结构,非常接近于AIFF和IFF格式。多媒体应用中使用了多种数据,包括位图、音频数据、视频数据以及外围设备控制信息等。RIFF为存储这些类型的数据提供了一种方法,RIFF文件所包含的数据类型由该文件的扩展名来标识。
WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。WAV格式的主要缺点是需要音频存储空间。对于小的存储限制或小带宽应用而言,这可能是一个重要的问题。WAV格式的另外一个潜在缺陷是在32位WAV文件中的2G限制,这种限制已在为SoundForge开发的W64格式中得到了改善。