打字猴:1.70050678e+09

1700506780

1700506781

1700506782

1700506783

1700506784 图9-9　声波波形

1700506785

1700506786 振幅量化有8位、16位、24位3种精度，声道也有单声道和双声道之分。以高精度的24位双声道，采样周期为44100次/秒来计算，存储1秒的声音需要的存储空间为：

1700506787

1700506788 C=16×44100×2=1411200bit

1700506789

1700506790 也就是每秒176.4KB，每分钟10.584MB。

1700506791

1700506792 如果使用无损压缩，则采用任何与普适的文件无损压缩没有差异的压缩算法就可以了。这里我们不多讲了，只说一下现在最常见的MP3格式究竟在压缩这个环节做了什么。

1700506793

1700506794 MP3的全称是“MPEG Audio Layer 3”，它是一种高效的音频编码方案，以较大的压缩比将音频文件转换成较小的扩展名为 .MP3的文件，并能基本保持原始文件的音质。

1700506795

1700506796 MP3采用了感知音频编码（Perceptual Audio Coding）这一失真算法。人耳感受声音的频率范围是20～20kHz，MP3去掉了大量的冗余信号和无关信号，编码器通过混合滤波器组将原始声音转换到频率域中，利用心理声学(5)模型估算刚好能被人耳察觉的噪声水平，再经过量化，将其转换成哈夫曼编码，形成MP3位流。解码器的工作就简单得多，主要是从编码后的谱线成分中通过反量化和逆变换提取声音信号。常见的WAV和MP3格式的频谱信息如图9-10和图9-11所示。

1700506797

1700506798

1700506799

1700506800

1700506801 图9-10　WAV频谱信息

1700506802

1700506803

1700506804

1700506805

1700506806 图9-11　MP3频谱信息

1700506807

1700506808 MP3格式去掉了那些人耳不太敏感的高频分量，减少了记录的信息，所以才具有高音质和高压缩比的特性。

1700506809

1700506810 以中等码率192kbps的MP3文件来说，每秒音频占用192kb的空间（流量），而每分钟则占用1.44MB（如表9-2所示）。

1700506811

1700506812 表9-2　不同频率的采样标准及其用途

1700506813

1700506814 频率用途 8kHz 电话使用 22.05kHz 广播使用 44.1kHz 音频CD 48kHz DVD、数字电视中使用 96～192kHz DVD-Audio、蓝光高清等使用在不同的应用场景中，采样率通常会有区别，而这也要视场景特性而定。对语音电话来说，只要保证沟通的内容能够听清楚就可以了，所以使用8kHz尽管音质不完美，却节约了大量的信道带宽资源。而在DVD蓝光高清这样的娱乐场景中，追求的是品质，所以在这种情况下会更注重音频的细腻性。这样的取舍逻辑我想每个人都会有一些感悟。

1700506815

1700506816 2．图片

1700506817

1700506818 在我们每天使用的办公电脑中，通常有两大类静态图形文件，一类是矢量图，另一类是标量图，后者更为常见。矢量图和标量图的最大不同在于图中信息的描述方式，当然这也为它们带来了各自的优势和局限性。

1700506819

1700506820 （1）矢量图

1700506821

1700506822 矢量图一般有用Corel Draw打开的 .CDR格式、用Illustrator打开的 .AI格式、用Photoshop打开的 .EPS格式等。矢量文件对图形中的每个元素对象进行描述，每个元素对象都是一个独立的实体，描述的信息包括颜色、形状、轮廓、大小和位置等属性，就连字体信息也都保存为一个字体的描述指针。3d Max这种用来做三维模型的专用软件，其文件也都是以这种对象和模型的描述形式来保存的（如图9-12所示）。

1700506823

1700506824

1700506825

1700506826

1700506827 图9-12　3d Max中的矢量模型文件可视化效果

1700506828

1700506829 这种描述方式的优势在于，由于描述的是一个对象信息，那么这个描述可以用“连续”的方式来表达。例如，在一个平面中声明一个圆形的信息，需要用哪些参数来描述呢？

[ 上一页 ] [ :1.70050678e+09 ] [ 下一页 ]