打字猴:1.70050678e+09
1700506780
1700506781
1700506782
1700506783
1700506784 图9-9 声波波形
1700506785
1700506786 振幅量化有8位、16位、24位3种精度,声道也有单声道和双声道之分。以高精度的24位双声道,采样周期为44100次/秒来计算,存储1秒的声音需要的存储空间为:
1700506787
1700506788 C=16×44100×2=1411200bit
1700506789
1700506790 也就是每秒176.4KB,每分钟10.584MB。
1700506791
1700506792 如果使用无损压缩,则采用任何与普适的文件无损压缩没有差异的压缩算法就可以了。这里我们不多讲了,只说一下现在最常见的MP3格式究竟在压缩这个环节做了什么。
1700506793
1700506794 MP3的全称是“MPEG Audio Layer 3”,它是一种高效的音频编码方案,以较大的压缩比将音频文件转换成较小的扩展名为 .MP3的文件,并能基本保持原始文件的音质。
1700506795
1700506796 MP3采用了感知音频编码(Perceptual Audio Coding)这一失真算法。人耳感受声音的频率范围是20~20kHz,MP3去掉了大量的冗余信号和无关信号,编码器通过混合滤波器组将原始声音转换到频率域中,利用心理声学(5)模型估算刚好能被人耳察觉的噪声水平,再经过量化,将其转换成哈夫曼编码,形成MP3位流。解码器的工作就简单得多,主要是从编码后的谱线成分中通过反量化和逆变换提取声音信号。常见的WAV和MP3格式的频谱信息如图9-10和图9-11所示。
1700506797
1700506798
1700506799
1700506800
1700506801 图9-10 WAV频谱信息
1700506802
1700506803
1700506804
1700506805
1700506806 图9-11 MP3频谱信息
1700506807
1700506808 MP3格式去掉了那些人耳不太敏感的高频分量,减少了记录的信息,所以才具有高音质和高压缩比的特性。
1700506809
1700506810 以中等码率192kbps的MP3文件来说,每秒音频占用192kb的空间(流量),而每分钟则占用1.44MB(如表9-2所示)。
1700506811
1700506812 表9-2 不同频率的采样标准及其用途
1700506813
1700506814   频率     用途     8kHz     电话使用     22.05kHz     广播使用     44.1kHz     音频CD     48kHz     DVD、数字电视中使用     96~192kHz     DVD-Audio、蓝光高清等使用   在不同的应用场景中,采样率通常会有区别,而这也要视场景特性而定。对语音电话来说,只要保证沟通的内容能够听清楚就可以了,所以使用8kHz尽管音质不完美,却节约了大量的信道带宽资源。而在DVD蓝光高清这样的娱乐场景中,追求的是品质,所以在这种情况下会更注重音频的细腻性。这样的取舍逻辑我想每个人都会有一些感悟。
1700506815
1700506816 2.图片
1700506817
1700506818 在我们每天使用的办公电脑中,通常有两大类静态图形文件,一类是矢量图,另一类是标量图,后者更为常见。矢量图和标量图的最大不同在于图中信息的描述方式,当然这也为它们带来了各自的优势和局限性。
1700506819
1700506820 (1)矢量图
1700506821
1700506822 矢量图一般有用Corel Draw打开的 .CDR格式、用Illustrator打开的 .AI格式、用Photoshop打开的 .EPS格式等。矢量文件对图形中的每个元素对象进行描述,每个元素对象都是一个独立的实体,描述的信息包括颜色、形状、轮廓、大小和位置等属性,就连字体信息也都保存为一个字体的描述指针。3d Max这种用来做三维模型的专用软件,其文件也都是以这种对象和模型的描述形式来保存的(如图9-12所示)。
1700506823
1700506824
1700506825
1700506826
1700506827 图9-12 3d Max中的矢量模型文件可视化效果
1700506828
1700506829 这种描述方式的优势在于,由于描述的是一个对象信息,那么这个描述可以用“连续”的方式来表达。例如,在一个平面中声明一个圆形的信息,需要用哪些参数来描述呢?
[ 上一页 ]  [ :1.70050678e+09 ]  [ 下一页 ]