首页 . 工学 . 信息与通信工程 . 信源编码 . 视频编码 . 〔视频编码经典算法〕 . MPEG-2

MPEG-2标准

/motion picture experts group-2 standard/
条目作者黄铁军

黄铁军

最后更新 2023-08-11
浏览 256
最后更新 2023-08-11
浏览 256
0 意见反馈 条目引用

国际标准化组织(International Organization for Standardization,ISO)和国际电工委员会(International Electrotechnical Commission,IEC)联合成立的运动图像专家组(motion picture experts group,MPEG)制定的一种视频和音频有损压缩的标准。

英文名称
motion picture experts group-2 standard
所属学科
信息与通信工程

MPEG是国际标准化组织与国际电工委员会于1988年联合成立的为数字视/音频制定压缩标准的运动图像专家组。MPEG-2标准是由MPEG制定的视频和音频有损压缩标准之一,发布于1994年,名称为“基于数字存储媒体运动图像和语音的压缩标准”,通常用来为广播信号提供视频和音频编码。此标准重要的部分有ISO/IEC 13818-1(系统)、ISO/IEC 13818-2(视频)和ISO/IEC 13818-3(音频)。

MPEG最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”以及组合编码。后来针对不同的应用需求,解除了用于数字存储媒体的限制,成为制定活动图像和音频编码标准的组织。

MPEG-1标准由MPEG制定,于1993年8月发布,用于传输1.5兆比特/秒数据传输率的数字存储媒体运动图像及其伴音的编码,其标准的正式规范在ISO/IEC11172中。MPEG-1标准是一个开放的、统一的标准,在商业上获得了成功。尽管其图像质量仅相当于家用录像系统(video home system,VHS)视频的质量,还不能满足广播级的要求,但已广泛应用于小型影碟(video compact disc,VCD)等家庭视像产品中,品质与VHS视频相当,并被用于制作只读光盘及分散式视频等。同时,MPEG-1标准也是MP3音频数据压缩格式的起源。

MPEG-2标准于1994年11月发布,与MPEG-1标准相比,MPEG-2标准具有更高的图像质量、更多的图像格式和传输码率。MPEG-2标准不是MPEG-1标准的简单升级,而是在传输和系统方面做了更加详细的规定和进一步的完善。它是针对标准数字电视和高清晰度电视在各种应用下的视频及伴音信号压缩方案,编码率为3~100兆比特/秒,传输速率为10兆比特/秒,适用于1.5~60兆比特/秒甚至更高的编码范围,并且与MPEG-1标准兼容。

视频编码利用去除帧图像的空间相关性和时间相关性进行编码,可以将帧图像看作一帧普通的JPEG图像。一帧JPEG图像的场景由若干像素点组成,而且其周围的灰度和亮度存在特定关系,这就是图像的空间相关性;一段视频是由连续的帧图像组成,每个帧图像都不是独立的存在,它们都与其前后的帧图像存在一定的关系,这就是图像的时间相关性。

MPEG-2标准图像压缩的原理就是利用图像中的空间相关性和时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。

MPEG-2标准的编码码流如图1所示。

图1 MPEG-2标准视频码流结构示意图图1 MPEG-2标准视频码流结构示意图

为更好地表示编码数据,MPEG-2标准用句法规定了一个层次性结构。它分为6层,从上至下依次为:视频序列层、图像组层、图像层、像条层、宏块层和像块层。除宏块层和像块层外,上面4层中都有相应的起始码,可用于因误码或其他原因收发两端失步时,解码器重新捕捉同步。因此一次失步将至少丢失一个像条的数据。

具体描述如下:①视频序列层。其序列是指构成某路节目的图像序列,序列起始码后的序列头中包含了图像尺寸、宽高比和图像速率等信息。序列扩展中包含了一些附加数据。为保证能随时进入图像序列,序列头是重复发送的。②图像组层。一个图像组(group of picture,GOP)由相互间有预测和生成关系的一组I、P、B图像构成,但头一帧图像总是I帧。I是帧内图(intra picture),P是预测图(predicted picture),B是双向图(bidirectional picture)。GOP头中包含了时间信息。③图像层。分为I、P、B三类帧图像。图像头中包含了图像编码的类型和时间参考信息。④像条层。一个像条包括一定数量的宏块,其顺序与扫描顺序一致。⑤宏块层。MPEG-2标准中定义了3种宏块结构,即4∶2∶0宏块,4∶2∶2宏块和4∶4∶4宏块,分别代表构成一个宏块的亮度像块和色差像块的数量关系。4∶2∶0宏块中包含4个亮度像块,1个Cb色差像块和1个Cr色差像块;4∶2∶2宏块中包含4个亮度像块,2个Cb色差像块和2个Cr色差像块;4∶4∶4宏块中包含4个亮度像块,4个Cb色差像块和4个Cr色差像块。这3种宏块结构实际上对应于3种亮度和色度的抽样方式。在进行视频编码前,分量信号R、G、B被变换为亮度信号Y和色差信号Cb、Cr的形式。其中,4∶2∶2格式中亮度信号的抽样频率为13.5兆赫,两个色差信号的抽样频率均为6.75兆赫,这样空间的抽样结构中亮度信号为每帧720×576样值,Cb、Cr都为360×576样值,即每行中每隔一个像素对色差信号抽一次样。4∶4∶4格式中,亮度和色差信号的抽样频率都是13.5兆赫,因此空间的抽样结构中亮度和色差信号都为每帧720×576样值。而4∶2∶0格式中,亮度信号的抽样频率13.5兆赫,空间的抽样结构中亮度信号为每帧720×576样值,Cb、Cr都为360×288样值,即每隔一行对两个色差信号抽一次样,每抽样行中每隔一个像素对两个色差信号抽一次样。通过上述分析可计算出,4∶2∶0格式中,每4个Y信号的像块空间内的Cb、Cr样值分别构成一个Cb、Cr像块;4∶2∶2格式中,每4个Y信号的像块空间内的Cb、Cr样值分别构成两个Cb、Cr像块;而4∶4∶4格式中,每4个Y信号的像块空间内的Cb、Cr样值分别构成4个Cb、Cr像块。相应的宏块结构正是以此基础构成的。⑥像块层。像块是MPEG-2标准码流的最底层,是离散余弦变换(discrete cosine transform,DCT)的基本单元。像块也用于表示8×8个抽样值经DCT变换后所生成的8×8个DCT系数。

为了在高效编码压缩的情况下,获得可随机存储的高压缩比、高质量图像,MPEG-2标准定义了I、P、B三种帧类型(构成了前述的图像层)。I、P、B表示1/25秒时间间隔的帧序列画面。I、B、P帧间排列如图2所示。

图2 I、B、P帧间排列示意图图2 I、B、P帧间排列示意图

具体描述如下:①I帧。I帧采用类似JPEG标准的编码方式实现,它不以任何其他帧做参考,仅仅进行帧内的空域冗余压缩。由于I帧图像是不参考其他图像帧的,只利用本帧的信息进行编码(即无运动预测、采用自身相关性),因此数据量大。由于图像序列间无相关性,因此可随机进入图像序列进行编码。②P帧。P帧是由一个过去的I帧或P帧采用运动补偿的帧间预测进行更有效编码的方法。P帧使用两种类型的参数来表示,一种参数是当前要编码的图像宏块与参考图像的宏块之间的差值,另一种是宏块的移动矢量。P帧的特点是其本身是前I帧或P帧的前向预测结果,也是产生下一个P帧的基准参考图像。优点是可提供更大的压缩比,缺点是前一P帧是下一P帧补偿预测的基准,如果前者存在误码,则后者会将编码误差积累起来并传播下去。③B帧。B帧可以提供最高的压缩比,它既可以用前面的图像帧(I帧或者P帧),也可以用后面的图像帧(I帧或者P帧)进行运动补偿,是一种双向预测编码方式。以前面的I帧或P帧代表“过去的信息”,后面的P帧或I帧代表“未来的信息”。由于同时使用“过去”和“未来”信息,故称为双向预测帧。由于B帧可以参考下一帧的信息进行编码,从而减少B帧的大小,相对P帧更小。

MPEG-2标准视频编码过程中,对于输入原始图像,会根据帧的类型进行相应的处理。当输入I帧图像时,此时只进行帧内编码,编码图像仅经过离散余弦变换、量化器和比特流编码器即生成编码比特流,而不经过预测环处理。离散余弦变换直接应用于原始的图像数据。若当前输入为P帧图像或B帧图像,此时进行帧间编码,原始图像首先与帧存储器中的预测图像进行比较,计算出运动矢量,由此运动矢量和参考帧生成原始图像的预测图像。而后,将原始图像与预测像素差值所生成的差分图像数据进行离散余弦变换并得到频率信号,根据帧的类型相对应的量化矩阵进行量化处理,以此来降低量化后的DCT系数的动态范围。之后将量化后的二维数据扫描成一维数据,再进行可变长编码,由比特流编码器生成输出的编码比特流,最终的视频流放到缓冲区中,直到有许可才能被传出。

如何去除空间冗余、时间冗余并且提高编码效率是MPEG-2标准编码的关键问题。由于I帧、P帧、B帧存在着大量的空间冗余和时间冗余,它们有着大量的自相关系数,MPEG-2标准主要通过DCT编码、运动估计/补偿和熵编码来解决上述问题。通过DCT得到的系数,其能量呈对角式分布。通过舍弃一些对视频视觉效果影响较小的次要信息,再进一步压缩,经过量化后会出现较多的零值,使得游程长度编码极大地改善了编码效率。

MPEG-2标准通过运动估计/补偿的方式来减少时间冗余,通过运动估计在编码时减少P帧和B帧的时间相关性,得到运动矢量,在解码时再通过运动补偿得到完整视频。通过这种方式,时间冗余被与视频相关不大的运动矢量代替,使之能够减少时间冗余。MPEG-2标准采用的是哈夫曼编码,对变换系数及运动矢量等信息进行熵编码。

MPEG-2标准视频的解码过程与其编码过程是相似的,利用其逆过程得到人们生活中看到的视频信息。

MPEG-2标准视频在编码与解码过程中都涉及了运动估计/补偿,因为运动补偿是基于运动估计得到的运动矢量进行的对应操作。运动估计的基本思想是将一帧图像分成很多不重复的块,然后对当前帧的每一块,对相邻的两帧以匹配准则做范围搜索,得到一个最相似的块(匹配块),比较前后两块的相对位置计算出相对的运动位移(即运动矢量)。块的匹配标准主要有:平均绝对误差、均方误差和归一化互相关函数。

MPEG-2标准的应用包括:①视音频资料的保存;②非线性编辑系统及非线性编辑网络;③卫星传输;④电视节目的播放。

MPEG-2标准编码是数字通用光盘(digital versatile disc,DVD)产品的核心编码技术。MPEG-2标准包含两部分:第一部分是MPEG-2标准系统描述部分,用来在非可靠介质上传输数位视频信号和音频信号的机制;第二部分是MPEG-2标准视频部分,与MPEG-1标准类似,区别是它提供对隔行扫描视频模式的支持(隔行扫描广泛应用于广播电视领域)。MPEG-2标准向后兼容,即所有符合MPEG-2标准的编码器也能够正常地播放MPEG-1标准的视频流。

此外,由于MPEG-2标准严格规定了语法和解码规则,以保证MPEG-2标准数据的互通性和兼容性,但对具体编码算法未做限制,为厂家优化提供了余地。因此,不同的多媒体应用可以采用不同的GOP类型长度和不同的码率,但只要遵循MPEG-2标准,都具有互通性。

  • 李光,白文利.剖析MPEG系列标准的演变过程.有线电视技术,2004,11(13):32-35.
  • 马长华.关于MPEG-2标准.广播与电视技术,1995,22(5):3-8.
  • 管泓.MPEG-2标准及其特点.通信与广播电视,1997(2):99-105.
  • 伍建平.MPEG-2标准及其应用.电视字幕(特技与动画),2001(12):48-50.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!