打字猴:1.700506867e+09
1700506867
1700506868
1700506869
1700506870
1700506871 其中,x和y代表图形数据矩阵某点的坐标,u和v是奇函数频率域中的坐标——相当于傅里叶变换中的ω;N是块大小,习惯上取8,也就是在8×8的空间里进行离散余弦变换。这种思想实际上可以认为是把音频信号中的f(t)迁移到二维离散空间来使用。变换完成后,每个波形利用无限多的不同周期的余弦波叠加而成的性质可以用来做周期的取舍,优先处理低频分量,通过舍弃高频分量来牺牲对于波形还原的精度。
1700506872
1700506873 这种变换完成之后,在一个8×8的矩阵中,有64个点的信息表示64个不同的波的振幅信息,低频分量的信息都集中在左上角的(0, 0)点,而向右向下,高频分量的信息增加,在(7, 7)点集中了所有的高频信息(如图9-17所示)。
1700506874
1700506875
1700506876
1700506877
1700506878 图9-17 DCT变换中的基函数
1700506879
1700506880 在这个环节可以通过对高频分量的舍弃来起到压缩的作用。如图9-18所示:图d表示的是64个频率描述信息叠加的波形效果,图a是3个,图b是6个,图c是15个。通过观察可以发现,在这个例子中,15个频率分量信息叠加的结果和64个已经很接近了,而这仅仅用了不到四分之一的频率信息。
1700506881
1700506882
1700506883
1700506884
1700506885 图9-18 不同频率分量叠加的还原效果
1700506886
1700506887 在前面获得8×8的频率振幅描述矩阵之后,再用这个矩阵与量化表中相应的值相除来进行振幅的压缩。如图9-19所示:左上角的除数比较小,而右下角的除数比较大,这就意味在相除之后低频的描述信息仍然比较丰富,而高频信息几乎没有了;左侧的低压缩率量化表和右侧的高压缩率量化表只是商的系数不同,高压缩率量化表在做除法的时候,显然由于除数很大而得到了更大的压缩幅度。
1700506888
1700506889
1700506890
1700506891
1700506892 图9-19 JPEG量化表
1700506893
1700506894 最后就是进行遍历和对遍历后的序列进行无损的哈夫曼压缩编码(如图9-20所示)。
1700506895
1700506896
1700506897
1700506898
1700506899 图9-20 遍历与编码
1700506900
1700506901 对图像压缩信息进行解压缩是刚刚这些步骤的逆过程,因为在压缩中有一些步骤是有损的,对高频分量进行了舍弃,所以在还原的时候无法获得和原始的RGB三通道或BITMAP相同的精度,但这个问题造成的影响很有限。
1700506902
1700506903 今天在互联网中大量使用的 .JPG文件就是基于这样的一种压缩思路,是不是非常巧妙呢?互联网能有如此之快的发展速度,与信息论及由它作为理论基础所发展而来的一系列强大的算法理论体系有着密不可分的关系。
1700506904
1700506905 3.视频
1700506906
1700506907 在本节的最后,我们讨论一下视频信息的压缩问题。
1700506908
1700506909 视频是现在在互联网环境中非常常见的一种媒体形式,不论是视频流还是视频文件,我们天天都会接触。
1700506910
1700506911 视频是一种典型的多媒体信息。我们通常说的视频是指图像信息和音频信息两个独立部分叠加的内容。对老的国产动画片有研究的读者估计会比较清楚,不论是像《大闹天宫》这样的工笔画动画片,还是像《阿凡提》这样的银丝木偶动画片,都是一帧一帧拍出来的(如图9-21所示)。
1700506912
1700506913
1700506914
1700506915
1700506916 图9-21 动画片《大闹天宫》和《阿凡提》
[ 上一页 ]  [ :1.700506867e+09 ]  [ 下一页 ]