新闻中心

EEPW首页>消费电子>设计应用> PC机的MPEG-4编码原理及实现

PC机的MPEG-4编码原理及实现

作者: 时间:2010-06-02 来源:网络 收藏

1.3 运动

运动对当前P-VOP和参考VOP进行运动估计与补偿,减小帧间的时间相关性,压缩。

通常采用块匹配法进行运动估计。块匹配法就是针对当前帧中某一特定大小的图像块,从参考帧的一定区域中找出该图像块绝对误差和(Sum of AbsoluteDifference,SAD)的最小匹配块,利用此匹配块来预测当前块。图像块的绝对误差和指两个大小相同的图像块的中像素差的绝对值之和。SAD16×16函数当前宏块和参考宏块间的绝对误差和;SAD8×8函数当前8×8块与参考8×8块间的绝对误差和。

确定了块匹配准则后,就要进行最优匹配点的搜索,校验模型最后采用钻石搜索法(Diamond Search,DS)。钻石搜索法是一种利用搜索模板的形状和大小,对运动估计算法速度及精度产生重要影响的快速搜索法。选用了两种形状和大小都不相同的搜索模板:一种是大钻石搜索模板(Large DiamondSearch Pattern,LDSP),它有9个候选位置:(0,0),(0,2),(1,1),(2,0),(1,-1),(0,-2),(-1,-1),(-2,0)和(-1,1)。具体模板如图3所示。一种是小钻石搜索模板(Small Diamond Search Pattern,SDSP),它包含5个候选位置:(0,0),(0,1),(1,0),(0,-1)和(-1,0)。具体模板如图4所示。



钻石搜索过程如下:以当前帧的当前宏块的左上角起点坐标为大模板的原点(0,0),在参考帧的搜索范围内,分别以大模板的(0,0),(0,2),(1,1),(2,0),(1,-1),(0,-2),(-1,-1),(-2,0)和(-1,1)像素点作为宏块的左上角起点,将该宏块和当前帧的宏块做SAD16×16运算,选择SAD16×16值最小的左上角起点作为暂时的最佳匹配点,此点与当前宏块左上角起点之间的位移就是运动矢量。判断此运动矢量是否适合特定的规则,如果不适合,则进行新一轮的大钻石模板搜索,直到找到适合条件的运动矢量。然后再以大钻石模板搜索的最佳匹配点为中心点(0,0),用小钻石搜索模板进行(0,1),(1,0),(0,-1)和(-1,0)四个参考点的精确搜索,搜索到的SAD16×16值最小点就是最终的最佳匹配点,最佳匹配点与当前宏块的左上角起点之间的位移就是最终的运动矢量。

以上是基于宏块的全像素搜索,还可以选择是否进行基于8×8块的全像素搜索。利用已经得到的基于宏块的运动矢量,找到基于宏块的最佳匹配点。此匹配点为中心(0,0),其他匹配点为(-1,-1),(0,-1),(1,-1),(-1,0),(1,0),(-1,1),(0,1),(1,1),分别以这9个匹配点作为8×8像素块的左上角起点,将该8×8块和当前帧的8×8块做绝对差值和的运算,选择SAD8×8值最小的左上角起点作为最佳匹配点,以找到最佳运动矢量,得到宏块内每个8×8亮度块的运动矢量和SAD8×8值。将4个SAD8×8的和与SAD16×16做比较,将较小值按照一定的规则处理,从而判断当前宏块的预测模式为帧内或帧间预测。

如果采用帧间预测,进一步采用半像素搜索。首先对整个参考帧进行双线性差值,则参考帧的面积变为原来的4倍,然后在特定的搜索范围内搜索出更精确的运动矢量,最后根据参考图像的亮度信息、色度信息和运动矢量做运动补偿。

如果采用帧内预测,不再对当前宏块进行任何运动估计,相应运动补偿后的参考宏块数值为0。

最后用当前帧减去运动补偿后参考图像得到差值,将差值数据进行纹理;对每个宏块的运动矢量进行预测并求出差分值,对差分值进行位流转换并输出。

2 编码器的实现和测试

根据图1并结合编码器各个模块的实现,进行编码器主函数的编写和调试。初步确定编码器的主函数应包括以下三部分:

初始化部分由于参考代码中存在RGB到YUV的图像格式转换函数(本文未介绍),则应开辟相应的存储BMP和YUV图像的空间;还要开辟空间存放编码器生成的压缩文件;必须设置编码器的编码参数。

编码处理部分此部分是通过循环编码各帧图像来实现的,读入一帧图像后,判断是采用I帧还是P帧,然后输出VOP头信息,进行当前VOP的编码并输出位流信息到缓冲器中,最后利用fwrite函数形成磁盘文件。

释放资源前面两个阶段开辟的内存空间必须释放掉,整个视频的编码过程结束。

结合参考的编码主函数,调试并运行编码器,生成divx文件,相应地调试出解码器。逐一更改编码器的量化参数QP、帧率、输出码率和I帧间隔参数,测试出它们对编码效果的影响,如量化参数QP、帧率和I帧间隔参数与压缩比成正比,输出码率与压缩比成反比。经过综合测试,在保证解码图像质量的前提下,当QP为8,帧率为30 f/s,输出码率为400 000 b/s,I帧间隔为3时,压缩比为58.8,此时达到最好的压缩效果。当然,如果对解压后的视觉效果要求不高的话,压缩倍数还可以继续提高。

3 结语

所讲的是MPEG-4标准的Part2部分,其编解码器已经获得了许多厂商的支持。目前,作为MPEG-4 Part10的H.264也已经推出并发展,相比MPEG-4 Part2,H.264在同样质量下,其码率能降低50%左右,说明MPEG-4一直在发展。随着基于内容的编码技术的实用化发展,MPEG-4将有更为广泛的应用前景。

本文引用地址://m.amcfsurvey.com/article/166700.htm

上一页 1 2 3 下一页

评论


相关推荐

技术专区

关闭