搜索
您的当前位置:首页正文

关于音频格式及编码

来源:榕意旅游网


关于音频格式及编码

音频格式即我们所知的音乐文件的后缀名,因此我们应该有如下认识:不同的后缀名表明的是此文件的内部格式不同,比如MP3的

末尾128个字节是ID3v1的标签数据而其它后缀的音频文件则不一定是,这就是音乐文件后缀名的作用(你可以把文件理解为一个包

裹,里面有很多小包,里面小包的多少和位置等就代表该包裹的内部格式),其实MP3文件里面可以放图片也可以放文字,但MP3

内部格式的划分注定它只有用来装音频数据才能发挥该内部格式化分的优势。如果你理解了上面的内容,那么接着我们将流行的音

频文件类型做个分类:

1)WAV:WAV实际上是Apple电脑上音频格式AIFF的克隆。通常我们使用WAV格式都是用来保存一些没有压缩的音频,但实际上

WAV格式的设计是非常灵活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你甚至可以在

WAV格式里面存放图像。但由于它本身的结构特点,注定了它的用途是存放音频数据并用作进一步的处理。

2)MP3:MP3是第一个实用的有损音频压缩编码,在MP3出现之前,一般的音频编码即使以有损方式进行压缩,能够达到4:1的

压缩比例已经非常不错了,但是,MP3可以实现12:1的压缩比例,这使得MP3迅速地流行起来。

3)MP3Pro:这种格式与之前的MP3相比最大的特点是能在低达64Kbps的比特率下仍然能提供近似CD的音质。该技术称为SBR

(Spectral Band Replication,频带复制编码),它在原来MP3技术的基础上专门针对原来MP3技术中损失了的音频细节进行独立

编码处理并捆绑在原来的MP3数据上,在播放的时候通过再合成从而达到良好的音质效果。

4)MIDI:MIDI本身也有两个版本,General MIDI和General MIDI 2。在MIDI上还衍生了许多第三方的非标准技术,比如非常著

名的X-MIDI(或者叫XG),这是由日本YAMAHA公司发明的,在原有的MIDI具有128种乐器的基础上扩充到了512种,并增加了

更多的演奏控制,配合YAMAHA自己的波表播放软件或支持X-MIDI的硬件可以还原出非常动听和接近真实乐器效果的音乐。

5)Ogg:Ogg Vorbis 是一种音频压缩格式,类似于MP3等现有的通过有损压缩算法进行音频压缩的

音乐格式。但有一点不同的

是,Ogg Vorbis格式是完全免费、开放源码且没有专利限制的。Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放源码的多媒体系统。Ogg Vorbis文件的扩展名是.OGG,这种文件的设计格式是非常灵活的,它

的最大特点是在文件格式已经固定下来后还能对音质进行明显的调节和更新算法。现在创建的OGG文件可以在未来的任何播放器上

播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。

6)VQF:VQF实际指的是TwinVQ(Transform-domain Weighted INterleave Vector Quantization)技术,是日本Nippon

Telegraph and Telephone集团属下的NTT Human Interface Laboratories开发的一种音频压缩技术,该技术受到著名的YAMAHA

公司的支持。VQF或TVQ是其文件的文件类型名。

7)WMA:使用VBR编码时,系统将自动为内容的简单部分分配较少的比特,从而留出足量的比特用于生成高质量的复杂部分。这

意味着复杂性恒定的内容(例如新闻播音)不会受益于VBR编码。对混合内容使用 VBR 编码时,在文件大小相同的条件下,VBR编

码的输出结果要比CBR编码的输出结果质量好得多。在某些情况下,与CBR编码文件质量相同的VBR编码文件,其大小可能只有前

者的一半。

下面谈谈编码形式.

我们都用过压缩软件,可以说压缩软件的压缩过程就是对被压缩数据的重编码过程,由于压缩软件可以把压缩过的数据完全恢复过

来,因此压缩软件在压缩数据时必然用的是无损压缩算法,同样在音频领域,对原来音频数据的压缩过程就是一个编码过程,该编

码过程可以采用很多种编码(压缩)方法,其中有无损压缩编码方式也有有损压缩编码方式。常用的第三方MP3编码方式如下:

1)CBR(固定比特率):使用CBR编码时,比特率在流的进行过程中基本保持恒定并且接近目标比特率,始终处于由缓冲区大小确

定的时间窗内。CBR编码的缺点在于编码内容的质量不稳定。因为内容的某些片段要比其他片段更难压缩,所以CBR流的某些部分

质量就比其他部分差。此外,CBR编码会导致相邻流的质量不同。通常在较低比特率下,质量的变化会更加明显。

2)VBR(可变比特率):使用VBR编码时,系统将自动为内容的简单部分分配较少的比特,从而留出足量的比特用于生成高质量的

复杂部分。这意味着复杂性恒定的内容(例如新闻播音)不会受益于VBR编码。对混合内容使用 VBR 编码时,在文件大小相同的条

件下,VBR编码的输出结果要比CBR编码的输出结果质量好得多。在某些情况下,与CBR编码文件质量相同的VBR编码文件,其大小

可能只有前者的一半。

3)LAME:目前开放源代码并且免费的编码器中最受欢迎的是LAME (Lame Ain Mp3 Encoder),这个工具是公认的压缩音质最

好的MP3压缩工具。

此外还有相当多的编码方式,一般来说,文件后缀名(如MP3其本身就是一种编码方式的名字,DTS它本身既是一种文件格式的

名字也是一种编码方式的名字)也是一种编码方式的名字,但是并不是文件后缀名相同其编码方式就相同,同一种音频文件类型

可以采用不同的编码形式来压缩音乐,所以,当你发现你的播放器不能播放WAV这种文件时,你就应该意识到这个WAV文件不是

用WAV这种编码方式编码的,它很可能是另一种你的播放器不能解码的编码方式编码的。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top