什么是H.264 / AVC? H.264 / AVC标准是由ITU-T和ISO / IEC联合开发的,旨在覆盖整个视频应用领域,包括:低比特率无线应用,标清和高清高品质电视广播应用, Internet上的视频流应用程序,高清DVD视频的传输以及数码相机的高质量视频应用程序等。

ITU-T将此标准命名为H.264(以前称为H.26L),而ISO / IEC则将其称为MPEG。

-4高级视频编码(AVC),它将成为MPEG-4标准的第一个。

10个部分。

由于AVC是当前MPEG-4标准的扩展,因此它将不可避免地受益于MPEG-4完善的基础结构(例如系统分层和音频等)。

显然,作为MPEG-4高级简单配置文件(ASP)的MPEG-4 AVC将优于当前的MPEG-4视频压缩标准。

方向。

如您在“视频编码历史”中所看到的,下表中,ITU-T和ISO / IEC负责自定义所有以前的国际视频压缩标准。

迄今为止,最成功的视频标准是MPEG-2,它已在DVD,数字电视广播(覆盖电缆和通信卫星)和数字机顶盒等各种市场领域中被广泛接受。

自MPEG-2技术出现以来,新的H.264 / MPEG-4 AVC标准极大地提高了编码效率和质量。

随着时间的流逝,H.264 / MPEG-4 AVC将在许多现有应用程序中取代MPEG-2和MPEG-4,包括一些新兴市场(例如ADSL视频)。

H.264 / AVC核心技术概述该新标准由以下处理步骤组成:-帧间和帧内预测变换(和逆变换)量化(和逆量化)对单个图像流进行编码的环路滤波器熵视频,可以将其划分为16X16像素的“宏块”。

此块方法简化了视频压缩算法中每个步骤的处理。

例如,将从标准清晰度标准视频流解决方案(720X480)拍摄的图片划分为1350(45X30)个宏块,然后在宏块级别执行进一步的处理。

帧间预测改进的运动估计。

运动估计用于确定和消除视频流中不同图片之间的时间冗余。

当运动估计搜索基于过去方向上的图片时,将编码图片称为“ P帧图片”。

当搜索基于过去和将来方向上的图片时,则将编码图片称为“ B”。

相框图片。

为了提高编码效率,为了在“ H.264运动估计-改进的运动估计”中包括和分离运动宏块。

如图所示,宏块被分成较小的块。

然后,先前或将来图片的运动矢量被用于预测给定块。

H.264 / MPEG-4 AVC发明了一个较小的块,它具有更好的灵活性,并且在运动矢量方面可以具有更高的预测精度。

帧内预测如果无法使用运动估计,则使用帧内估计来消除空间冗余。

内部估计通过从预定义集中的不同方向上的相邻块中推断出相邻像素来预测当前块。

然后,对预测块与实际块之间的差进行编码。

此方法是H.264 / MPEG-4 AVC特有的,对于通常具有空间冗余的平坦背景特别有用。

“转换”指的是通过变换将运动估计和内部估计的结果从空间域变换到频域。

H.264 / MPEG-4 AVC使用整数DCT4X4转换。

MPEG-2和MPEG-4使用浮点DCT8X8转换。

具有较小块的H.264 / MPEG-4 AVC减少了阻塞和明显的伪像。

整数系数消除了由MPEG-2和MPEG-4中的浮点系数运算引起的精度损失。

量化对变换后的系数进行量化,从而减少了整数系数的预测量,并消除了不易察觉的高频系数。

该步骤还用于控制输出比特率以保持基本恒定的常数。

环路过滤/H.264/MPEG-4 AVC标准定义了对16X16宏块和4X4块的边界进行去块和过滤的过程。

在宏块的情况下,滤波的目的是消除由具有不同运动估计类型(例如运动估计和内部估计)或不同量化参数的相邻宏块引起的伪像。

在块边界的情况下,过滤的目的是消除可能由