1700506917
1700506918
人眼对连续运动的物体的敏感度也是有限的,一幅一幅的静态画面快速连续播放,就能让人得到视觉动感。一般来说,大于30fps(8)就不会让人感到明显的动作跳跃感,换言之,视频文件的画面部分存储了大量的一帧一帧的静态画面信息,然后快速播放给观众看,这种技术原理在视频流和视频文件中通用。在前面我们已经知道,单幅静态画面可以通过离散余弦变换来进行信息压缩(牺牲一些高频分量来获取较高的压缩比),那么对动态画面有什么更好的处理方法吗?也是有的。
1700506919
1700506920
以H.264(9)编码标准为例,由于视频本身的特点,相邻的帧之间通常相似度比较高,像素、亮度、色度的变化都非常小。所以,对一段变化不大图像,可以考虑用数据增量的方式实现,这样做会节省大量的传输带宽。
1700506921
1700506922
H.264编码标准定义了3种帧(如图9-22所示)。完整编码的帧叫作I帧,又称“内部画面帧”(Intra Frame)。I帧中是一帧完整的图像信息。参考之前的I帧生成的只包含差异部分编码的帧叫作P帧,又称“预测帧”(Predictive Frame)。还有一种参考前后的帧编码的帧叫作B帧(Bi-Directional Frame)。当把一帧压缩成B帧时,它会根据相邻的前一帧、本帧及后一帧数据的不同点来压缩本帧,也即仅记录本帧与前后帧的差值。只有采用B帧压缩才能达到200∶1的高压缩比。H.264编码标准采用的核心算法是帧内压缩和帧间压缩相结合的方法,帧内压缩是生成I帧的算法,帧间压缩是生成B帧和P帧的算法。
1700506923
1700506924
1700506925
1700506926
1700506927
图9-22 时间序列上的I帧、B帧和P帧
1700506928
1700506929
一个I帧到下一个I帧之前的部分叫作一个画面组(Group of Pictures,GOP)。接收端收到连续不断的GOP,就可以连续不断地根据I帧、P帧和B帧中记录的差异量逐帧进行完整的复原,再在显示环节进行渲染,这样就能还原出原始的视频信息。在一个GOP中,只要I帧不丢失,那么即使有个别P帧或者B帧丢失,对画面感官的影响也是有限的。如果I帧丢失,那么整个GOP所附带的信息就没有还原的可能了,画面观感会非常差,有可能会严重花屏或黑屏,这样就只能等着下一个I帧的到来,从而得到一帧完整的画面信息。
1700506930
1700506931
如果读者做过DBA,或者对Oracle数据库比较熟悉,就能很容易联想到,这种方式和Oracle进行全量备份和增量备份的方式相同。通过一次完整的库扫描,把数据块的信息用RMAN进行备份,之后要进行增量备份时,只需要备份那些从上次备份时起到当前时间为止的有变化的块信息,而不需要备份整个数据库,节省了大量的时间。
1700506932
1700506933
1700506934
1700506935
1700506937
数据科学家养成手册 9.6 本章小结
1700506938
1700506939
在这一章中,我们讨论的是关于信息熵和信息量的问题,以及利用这种规律进行的数据压缩与传输的整个理论依据和技巧思路问题。
1700506940
1700506941
除了在有损压缩的部分利用人对模拟信号的不敏感性进行了信息丰富程度与压缩比的取舍以外,剩下的各种关于数据压缩的思路都是从信息论中关于信息和信息冗余的思路发展而来,真可谓殊途同归。
1700506942
1700506943
对信息论的讨论到此告一段落。如果读者对这部分内容有更大的兴趣,可以参阅其他技术论文和专业书籍。对纯粹的工程层面应用来说,只要牢记信息承载中这种由于信息出现的概率不同而产生的无损压缩应用就足够了。
1700506944
1700506945
(1) 哈特莱(R.V.L. Hartley),1888年11月~1970年5月。
1700506946
1700506947
(2) 29是512,log2512=9;210是1024,log21024=10。
1700506948
1700506949
1700506950
(3) 信噪比=。
1700506951
1700506952
(4) 戴维·哈夫曼(David Huffman,1925年8月~1999年10月),美国加利福尼亚大学计算机系著名教授。
1700506953
1700506954
(5) 心理声学(Psychoacoustics)是研究声音和它所引起的听觉之间关系的一门边缘学科。
1700506955
1700506956
(6) 联合图像专家小组(Joint Photographic Exports Group),隶属ISO国际标准化组织。
1700506957
1700506958
(7) YUV是欧洲电视系统采用的一种颜色编码方法,Y表示亮度(Luma),U和V表示色度(Chroma)。
1700506959
1700506960
(8) 帧每秒(Frame Per Second),用来描述视频播放速度的技术指标。
1700506961
1700506962
(9) H.264是国际标准化组织(ISO)和国际电信联盟(ITU)共同提出的继MPEG4之后的新一代数字视频压缩格式。
1700506963
1700506964
1700506965
1700506966
[
上一页 ]
[ :1.700506917e+09 ]
[
下一页 ]