数字音频的历史和现状

数字音频已经有“悠久”的历史,大概与电脑自身的历史差不多。早期的电脑工作室尝试创造各种变形的声音,用在艺术家的作品中添加色彩。这类试验很快就变得更加严肃,电脑硬件和DSP开发者开始探索建立适合商业化的系统。

译者:金毓镇

作者前言

  试图叙述当前的电脑数字音频状况就象射击移动的目标一样,直到刊出这篇文章之前我都在犹豫,因为事情变化太快,今天的热门思想也许到明天就成了绊脚石。但愿本文对了解电脑数字音频技术的发展和走向有所帮助。

上古时代
  
  电脑数字音频已经有“悠久”的历史,大概与电脑自身的历史差不多。早期的电脑工作室尝试创造各种变形的声音,用在艺术家的作品中添加色彩。这 类试验很快就变得更加严肃,电脑硬件和DSP开发者开始探索建立适合商业化的系统。其中Max Matthews是著名的Music N系统的开发人,John Chowning在斯坦福大学研究的FM合成被使用在YAMAHA的DX7合成器上。二者是今天习以为常的乐器与演奏记录分离的最初实例,这些应用很快让 电脑从只会发出简单的蜂鸣声发展为完全的音频机器(不过是非实时的)。当电脑变得更加便宜,音乐家能够买得起家用电脑,使用这些机器来做录音(起码是编 配)引起了音乐家的极大兴趣。早期的电脑如Apple II和Commodore 64做数字音频录音还不够快(实际上还缺少存储作品的硬盘),但是用苹果机的Alpha Syntauri作曲系统(包含简单的制谱和波形合成)以及Commodore电脑的Sequential Circuits音序器做一些简单的编配已经很好了。简单的软件Electronic Arts Music Construction Set(MCS)原来是为许多音乐爱好者在家用电脑上使用的,它预示了电脑和音乐在商业上的第一个巨大成功—MIDI。

成功的MIDI

  MIDI是80年代初期许多领导潮流的合成器厂商之间一次空前合作的结果,MIDI规定允许音乐设备间互通信息,其内容从按动键盘,操作控制 器到改换音色等。最初的想法只是让机架上的合成器发出更多声音(演奏一个音符却同时听到许多声音)。由于MIDI的数字属性,它很快就从乐器(最初主要是 键盘)扩展到电脑。早期的MIDI/电脑合作从简单的消费电脑如Commodore 64使用的MIDI接口开始,配合Dr.T或Hybrid Arts公司的软件。Atari推出ST系列电脑使MIDI变得更加流行,因为MIDI输入和输出插座成为ST系列电脑的标准配置。大约与此同时,一些公 司推出用于Commodore、Macintosh、PC(DOS)平台带有同步功能的MIDI接口,最著名的有MIDIMAC和Roland MPU-401。一些公司开始推出用于合成器控制的新软件,包括音色编辑,自动作曲和数字音序器(最重要)。这些音序器记录来自键盘的各种信息,可以修改 并发送到任何其他键盘。很快,这些电脑程序变成了合成器音乐的标准作曲工具。Steinberg的Pro-24是Atari平台的主要表演者(带有强烈的 欧洲风格),当时PC平台的强者是Cakewalk和Voyetra。Macintosh开始成为音乐家的领导平台,两家革新派公司Opcode和 Mark Of the Unicorn着手开发新一代电脑音乐系统。值得注意的是当时的MIDI音序器(无论任何平台)作为作曲工具,并不包含音频成分,基本上只是MIDI键盘 和机架音源的控制程序,它仅成为录音棚制作录音的装饰。实际上录音界许多人把合成器和电脑音序器看做非专业和生活在幕后的“创造型”工具而不是控制室的主 体。

声音设计工具 

  通过电脑使用音频实际上是从后门进入的。当时需要帮助采样合成器设计声音的程序,SampleVision(PC平台),ADAP SoundRack(Atari平台),Sound Designer(Atari平台,后来用于Mac)是最早出现的这类软件,用户可以修改样本并送回它们所支持的采样器。为了听见被编辑的声音,程序使用 电脑内置的音频功能或要求通过声卡回放。当电脑变得更快,声卡进一步改善了品质,也就出现了更多声音方面的开发。Digidesign的软件包 TurboSynth让用户从音频元素开发声音,虽然还不是实时的。这些程序是Native Instrument的Reaktor等可以让用户创造从来没有听见过的声音软件的前身。一些音乐形式(特别是Electronic Industrial)完全依赖这些程序,而且建立在电脑基础上的声音设计也变成制作人手中一件重要和确定的工具。

早期的Digidesign

  这时电脑已经更加强有力,但是很明显还不具备处理高品质音频录放的能力。一家小公司Digidesign(前面叙述声音设计时曾提及)推出一 个惊人的系统叫SoundTools,掀起了真正的革命。音频卡与接口的联合提供了高品质的数字和模拟I/O,电脑内部的数字接口和 摩托罗拉DSP 芯片帮助电脑拥有处理数字音频的能力。结合专门开发的软件,SoundTools成为第一个真正能替代2轨磁带录音机(不论模拟或DAT)的电脑系统,并 且开辟了数字编辑的新世界。当然它的速度还不够,价格昂贵,某些用户界面比较粗糙。但是一部分录音界欢迎SoundTools这件开放式武器,而专业界一 些人认为它不过是玩具或者声音很糟糕。此时不少专业用户使用数字录音座完成他们的全部工作,这个时期处于专业级的转换和混合算法刚开始提到日程上的阶段。 总之,Sound Tools因为能够为最终的处理提供一套音轨而变成母带制作世界的标准工具。它的极端灵活性和比一般水平更高的声音也把它带进了录音棚,无论当作“ 备份”设备或幕后的瑞士军刀。

早期的“原生”

  [译者注:Native在电脑技术上指单纯依靠CPU能力完成工作,中文译名不统一,这里暂且译作“原生”]电脑继续以惊人的速率在提速,几 乎每翻过一张日历,PC和Mac的速度就加快一倍。音频卡已经达到了标准的规格(16-bit,44.1kHz采样率,数字I/O)。作为不可避免的结 果,领先的音序器开发商终于找到了把音频轨和MIDI音序器结合的途径,为作曲和录音打开了更加完整的解决方案。 Macintosh平台音序器的领导Opcode率先推出MIDI音序器和音频轨结合的Studio Vision,使用第三方厂家的高质量音频接口,音频轨可以与MIDI轨一同运行,给全世界的作曲家带来了欣喜。接着MOTU很快推出了Digital Performer,Windows平台则有Cakewalk4.0(虽然最初音频同步能力较差)。这时,音频软件开始冲击企业录音棚,因为一台好的电脑 加上软件的价格仍低于同等级的录音硬件设备和磁带。在这些强大的音序器软件之外还有一些单纯用于音频的软件产品,其中早期的有Deck(原来属OSC,现 在归BIAS)和Innovative Quality Software的SAW。这些软件更接近典型多轨录音机和调音台的模拟,使录音师感觉比MIDI音序器和音频轨结合的软件容易使用。但是因为缺乏已有的 用户基础(如同音序器那样已经建立的),导致单纯音频的软件进入市场缓慢。

欧洲的力量(Steinberg, Emagic)

  MIDI和音频的列车已经开动,一些新角色登台表演。两家德国公司Steinberg和Emagic给他们的MIDI音序器添加了音频功能, 参与到美国软件占主导地位的市场竞争。Emagic从生产Atari软件的德国公司C-Lab分离出来(C-Lab曾推出Atari音序器软件 Creator,以后增加了制谱功能,改名为Notator),C-Lab继续生产MIDI/同步接口等产品,Logic则从Atari平台转向 Macintosh,很快推出仅有MIDI功能的音序器Logic,不久后演变为带有音频的Logic Audio。这个热门软件包含用户可以确定结构的系统,对于需要细致的个人化设置和大量使用各种控制的用户具有特别的吸引力。与之形成对比的 Steinberg完全使用预定的结构,但是预置非常充分。软件原名Cubie,后来改变为Cubase,虽然不可避免有些缺憾,但是在帮助音乐家容易使 用方面做得很好。Logoc和Cubase立刻就成了业界的领袖,受到广泛的欢迎直至如今。


DSP还是Native(ProTools和VST)

  当时的电脑不能满足音频软件的要求。甚至在只运行音频软件,不做其他工作的情况下,电脑的能力仍然落后于用户的希望。每一次软件升级都要增添 新功能,同时对电脑提出更多要求。鉴于电脑的能力,许多设计只好暂且退让。市场上很快就出现了新的突破。最初是Digidesign推出他们完全建立在 DSP基础上的效果和混合系统Pro Tools。从许多方面看,Pro Tools都显示了系统建立在软件基础上的最高水平,高品质的数字转换器和 摩托罗拉DSP 系统免除了电脑大量繁重的负担。这套系统很快在专业界流行,对Pro Tools的认知变成对于专业录音工程师非常重要的事情。但是Pro Tools难以进入许多小型企业录音棚,原因之一是价格比较昂贵;之二是它仅能工作在Macintosh平台。 Steinberg接受这场挑战的举措是向全世界推出两个标准,一个是ASIO I/O标准,允许音频卡厂家为自己的卡建立对音乐家友好的驱动,确保在Cubase环境中有最低的等待时间。第二个也许更加重要的是VST效果标准,它定 义了CPU原生效果处理的标准,易于实现,易于使用,而且廉价。没过多久,其他音频和音序软件开发商就都搭上了VST和ASIO快车。实际上除了少数例外 (特别是MOTU和Cakewalk),VST和ASIO变成了音乐软件的工业标准,直到今天。

2轨编辑和CD刻录

  当多轨音频和MIDI软件争相吸引用户目光的同时,一些有意思的事情正在幕后展开——电脑为基础的2轨编辑和CD刻录变成所有水平录音棚的标 准配置。当功能广泛的软件甚至累坏了更快的电脑时,2轨录音和编辑对于典型的电脑系统都很轻松,而这些软件详细编辑的可能性远远超过任何硬件设备(电脑鼠 标代替了传统的刀片)。带有高品质音频卡的电脑很快在企业录音棚中取代了开盘机和DAT,PC平台上有Sonic Foundry的Sound Forge和Steinberg的WaveLab;BIAS Peak和TC Works Spark则取代了Macintosh平台的Sound Designer。这些软件超出了简单的剪、贴编辑,具有增益控制、音高/长度修改和区域管理等功能,企业录音棚用户可以靠它们制作CD母带。这类产品还 有许多:Digidesign的Masterlist CD,Adaptec(现在是Roxio)的Jam和Toast,Sonic Foundry的CD Architect等提供了制作红皮书标准CD的工具,电脑工业的发展使CD驱动器和盘片的价格跌落到人人都买得起它们,家庭制作CD不但极其便宜而且有 最好的声音。

软件乐器

  再回来看多轨音频和音频MIDI音序器,VST和ASIO革命给原生系统带来一些标准,虽然同时也给电脑CPU带来更多负担,使系统更不稳 定。感谢Steinberg开发的VST 2.0标准,使CPU的负担得以减轻。 VST 2.0标准打开了某些先前难以想象事情的大门,软件乐器似乎镶嵌进录音软件中。这些VST几乎立刻就被企业录音界采用了,因为它们比硬件合成器更便宜,而 且它们的状态可以与录音工作一并储存。这在几个月前也是不可想象的——打开一个存放很久的录音,全部MIDI和音频轨,效果结构和乐器设置都恢复到当初的 状态。新的插件给电脑CPU带来非常沉重的负担,很容易使一般的电脑过载。幸亏VST乐器的介入符合快速增长的CPU速度以及同步下降的电脑价格。这些因 素的联合完全改变了企业录音棚的面貌,许多人从此彻底放弃了硬件合成器和录音设备。

回归自然

  在软件录音棚的快速冲击中,人们开始发觉某些熟悉的操作特点消失了。当人们离开了模拟调音台,合成器退到幕后,鼠标也就替代了过去的旋钮和推 子,然而录音工程师对失去的环境耿耿于怀。1995年Mackie Designs推出全新的概念——“控制界面”,用真实的旋钮和推子控制电脑屏幕上的软件操作。建立在MIDI基础上的控制器在音序器和合成器的早期就得 到普遍应用,但是Mackie的HUI(Human User Interface人性用户接口)定义了新的控制集合。马达化推子和数字化旋钮可以提供软件混合功能的实时反馈,由此引导到更为有机和人性化的混合。由此 造成的局面给一家小公司CM Automation推出更加便宜和小型化控制界面的机会。他们的Motormix瞄准了众多企业录音棚,为软件录音棚提供实在的推子和旋钮。


音频文件编年史

MIDI/ 祖辈(爷爷)
            老爷爷辈的音频文件格式。1980年初登场。
 WAV/祖辈(奶奶)
        1990年初与WINDOWS操作系统一起出现。  老奶奶辈的音频文件。
MP3/1代
        1987年由德国一研究所开发,1992年被命名为MP3。
RM/2代
        1995年在REALNETWORK的流技术基础上产生。
AAC/3代
            1997年由MPEG音频集团(SONY,AT&T等)开发,也被称为MP4。
VQF/4代
            1998年日本NTT研究所开发。
WMA/5代
            1999年微软公司利用流技术开发出了ASF格式,它的后期版本就是WMA格式。
OGG/6代
        1998年美国 MIT在校生蒙哥玛利等开发研制, 2000年后进入实用阶段。
APE/7代
        2000年马修.艾斯兰德开发。
mp3PRO/8代
        2001年法国Thomson多媒体发布的新一代音频文件格式。

在HowPC整理的mp3系列名称列表里,可能还遗漏了很多声音文件格式的名称。这些没有写上去的形式通常都是与mp3系列有较大差别、或者是没有出现多 久就消失在市场汪洋中的声音文件格式。其中,ROL格式是无论如何也不能舍去的,虽然在国内它曾经输给过IMS格式(此格式曾经用在天牛通信节目 “故事”中),但是在1990年初确实以 Adlib 的名字吸引了很多人的注意。再有一个就是通过PC通信得以发展的IMS格式。因为它支持ISS格式(此格式曾经在'IMPLAY'练歌厅节目中用于显示歌 词)而一度名声大噪。此外,还有在声音风暴中用于dos的VOC 数字声音格式和在媒体编辑节目中广泛使用的cakewalk的专用媒体文件格式WRK。这些格式共同的问题就是音质比较差,随着WINDOWS逐渐普及, 它们便都销声匿迹了。

MP3家族的老祖宗到底是谁呢?当然应该首推兼容性和转换性优异的MIDI与 WAV 格式。至今MIDI格式还被应用在因特网的主页背景音乐上,显示出其顽强的生命力。与先录音再压缩的WAV, MP3, RM格式不同,只要把电子乐器连接到声卡的MIDI 端口,声音就能够自动转换成MIDI格式文件。之后,随着微软WINDOWS操作系统的普及,由微软推出的WAV 格式得到了广泛的应用。这种格式可以把模拟音频波形转换为数字信号储存,根据其格式化性质,使音质产生一定的变化。一般CD级音质满足16bit, 44.1kHz, 立体声格式。作为现在最基本的音频文件格式,WAV几乎可以转换为所有类型的数字音频格式。

但是,WAV作为一种未压缩格式,容量过大便不易进行保存。因此,现在一般把它压缩成MP3, WMA(ASF),OGG, APE, mp3PRO 等格式保存。MP3系列也出现了功能全面的升级版。

1990年初,随着WINDOWS的普及,声音文件格式的标准渐渐向以与WINDOWS相兼容的MS和IBM数字声音文件格式靠拢。这些格式由于没有进行过压缩,所以通常便于向其他声音文件格式的转换操作。要理解WAV格式首先要了解图像文件的形式。

在图像中,决定画质的关键因素是像素的数量和颜色。把整个图像分成很多独立的小区域点(Pixel),并将一定的颜色赋予这些区域点,就可以把一幅彩色图 像显示在电脑屏幕上了。电脑播放音频文件也是基于同样的原理,将音频信号分解成很多个很小的时间单元,然后在给每个时间单元赋上节奏(取样, Sampling)就可以使电脑播放音频信号了。决定时间单元长度的单位与选择像素的数量时采用的是同一个道理,你可以选择Sampling周期或是 Sampling频率(22kHz, 44.1kHz, 48kHz)等。

正如像素数是表示影像大小与细致程度的术语一样,音频方面的术语称为采样尺寸 (Sampling Size)或采样比特数(Sample Bit),常用8bit和16bit的采样数。 8bit 时,音的强弱是 28,即被分为256个单位来表示;16bit时是216,即 65,536个单位。也就是说,比特数是决定音质的关键。

此外,采样的间隔对音质也有不小的影响。采样间隔越大,音质越差;反之,音质就越好。而且,采样间隔大了,在播放时会产生曲折现象,甚至完全失真。人耳能够听到的频率是20~20,000Hz,我们一般要用比最高频率快2倍的 44.1kHz作为采样数来录音。

数字音频的采样频率一般为44.1kHz(CD)和48kHz(DAT), PC等有时也会用 11kHz、 22kHz 的采样频率。44.1kHz的采样频率意味着每秒钟要完成 44,100采样。


音乐 CD能把模拟形式的音乐音频信息以44.1kHz的采样速率读写后转存为数字信号。每一个采样信息储存后占16bit(2Byte)的空间,而且,要达到 CD的立体声效果,还要用左右2个频道同时录音。所以,在CD上录制1分钟的音乐,按照下面的公式大约占用10MB的空间。以一首歌3分钟计算,录到CD 上的容量大概是30MB。(44,100次采样/秒)*(2Byte/采样)*2频道*(60秒/分)=约 10MB/分。



作者:Darwin Grosse   更新日期:2005-10-22
来源:Recording杂志   浏览次数:

相关文章

相关评论   发表评论