计算机对音频信号的处理,PC机用户都不陌生。对于玩多媒体的计算机用户,音频处理更是轻车熟路了。实际上,数字音频应该追溯到1983年的CD音乐,全数字式的录音设备和混频系统,它早就进入了专业的音频制作领域。
同视频处理一样,要在计算机内处理音频,也要通过A/D转换把模拟信号转换为数字音频信号。当然,对于以数字方式存储的音频,要另当别论。A/D转换过程,同样由采样和量化构成,但其采样速度要比视频处理低得多。人耳能听到的声音,最高频率为20KHz,因此音频的最大带宽为20KHz,故而采样率需要介于40KHz和50KHz之间,这与视频采样速率比较起来是相当低的,但它们对每个样本需要更多的量化比特数。在前面对视频量化的分析中,46dB的信噪比被认为是最合理的。但具有同样信噪比的音频信号,则是不可接受的。实验证明,要在正常收听期间听不到噪声,必须达到大于70dB的信噪比。当考虑到制作的附加要求时,音频数字化的标准就变成了每个样本16位,从而得到96dB的信噪比。
16位数字音频的标准量化是线性脉冲编码调制PCM,每一量化都具有相等的长度。在音乐CD制作中,采用的正是这一格式。如果采样的速率低于每个样本16位,则可以使用其他的几种量化方法。当每个样本为12位或14位时,最好使用一种非线性PCM格式,在这种方法中,低信号电瓶的量化步长小于高信号电平的步长。
对于数字音频,同样也可以采取压缩处理,以减少文件长度。较高级压缩使用差分脉冲编码调制DPCM来实现,在这种方法中,只有相邻之间的插值被量化器编码,而不是样本值本身的问题。如果相邻值具有类似的幅度,则这种方法十分有效。但是,如果信号含有大量的接近奈奎斯特极限频率的成分,则相邻值将是很不相同的,DPCM系统将不能够维持,而且会引起高频部分的严重失真。
针对DPCM 存在的固有问题,人们引入了自适应系统来加以解释,这就形成了自适应差分脉冲编码调制ADPCM。它根据音频信号的电平或高频成分,把一个比例因子用于可动态变化的差分位。因此,当信号小时,差分位控制小的幅度步长;而当信号大时,它们控制大得多的增量。由于采用ADPCM的播放系统必须知道这个比例因子,所以要将比例包含在解码器处理的差分位流中。ADPCM是一种有损压缩技术,它的缺点是能引起信号质量的降低。
和视频信号相比,由于缺乏类似的视频的结构信息,数字音频的压缩较为困难。因此目前高质量的压缩方案,都是通过模拟人耳听觉来确定哪些成分在音频信号内可能是冗余的,像前面提到的MPEG压缩标准一样,利用人耳的音频掩盖特性,进行了数字音频压缩。不过,即使如此,压缩比也仅限于6∶1。
另外,计算机处理音频信号,既可以是双声道立体声,也可以是单声道,这要根据最终的需要加以决定。无谓的采用立体声,会增加计算时间,增加文件容量。在计算机中,音频的采样速度、采样位数都是可以调整的,这也要根据最终的用途加以选择。
WAV格式的音频文件是声音通常的存储方式,它可以在Windows的媒体播放机中播放,是一种通用的声音文件格式。另外,还有一种声音文件格式为MIDI,这种文件存储的不是声音的波形信号,而是各种乐器的演奏信号,非常类似于乐谱,需要用声卡中的MIDI处理电路把它转换为波形信号后,才能在音频设备中播出。MIDI文件没有存储实际的波形信号,因而其容量是相当小的,其缺点是播放的时候,需要声卡硬件的支持。因此,在我们的非线性编辑软件核心——Premiere 6.0中,并不支持MIDI格式的文件。
MP3格式的音频文件是利用 MPEG Audio Layer 3技术, 将声音用 1:10 甚至 1:12 的压缩比率,压缩成为一个较小的音频文件。在Adobe Premiere以前的版本中是不支持MP3格式音频文件的,在最新的Adobe Premiere 6.0中才增加了MP3的压缩编码。我们可以输入MP3文件,并可以对它进行任意的非线性编辑,如同WAV格式的音频格式一样。