现代图像编码方法

时间：2024-10-09 百科知识版权反馈

【摘要】：分形用于图像编码比较有效的方法是1984年M.F.Barnsley提出的迭代函数系统。目前已有不少研究人员在着手使分形图像编码商品化。有的文献称第一类方法为“语义基”图像编码，第二类方法为“物体基”图像编码。鉴于它的这些先进性，本书将它归入现代编码方法行列。从当前来看，现代编码方法仍处于深入研究阶段。

4.2.2　现代图像编码方法

经过四十多年的努力，人们形成了一系列完整、实用的编码方法，这就是一系列的国际编码标准，如JPEG、MPEG(1、2、3、4)。每一个标准都是几种算法的综合运用。这些标准的算法大都是基于DCT变换的(MPEG－4除外)。先将图像分为8×8的方块，再对这些小方块分别进行DCT变换。这种分割使得更大范围内的相关性被忽视，因而妨碍了更大压缩比的获得。现代编码方法则利用图像的整体特性，在整个图像范围内消除图像的相关性，实现了从“波形”编码到“模型”编码的过渡，从理论上突破了信息论的框架。在图像质量相当的情况下，现代编码方法与经典方法相比，压缩比可以提高几十倍或更高。现代编码方法主要有分形法、模型法、神经网络法和小波法等。

(1)分形法。波兰出生的美国数学家B.B.Mandelbrot通过研究不规则形状和过程的性质，建立了自然界的分形几何理论。1975年他根据拉丁文“fractus”造出了“fractal”，即“分形”一词，用于描述自然界各种各样景物的复杂形状。

分形用于图像编码比较有效的方法是1984年M.F.Barnsley提出的迭代函数系统(IFS)。它把一幅图像分解为若干类景物的子图像，对每类子图像寻找出一个分形算法，简称为IFS码，使这组IFS码所综合的分形图像在主观上与原始子图像非常相似。由于IFS码的信息量比原始图像要少得多，因而可以获得较高的压缩比。分形编码的高压缩比、解压缩时的高速度以及不受分辨率影响的特点使分形编码技术已越来越多地应用于多媒体技术。目前已有不少研究人员在着手使分形图像编码商品化。

对于整体与局部存在明显相似性或仿射性的图像，如树、树叶、云彩等，分形压缩算法能获得极高的压缩比。

(2)模型法。模型法图像编码首先由瑞典的Forchheimer等人于1983年提出，它不要求图像信号一定具有自相似性，可以用更普遍、更基本的基元(如三角或椭圆)来建立模型。基于模型或知识的方法，是在编码过程中，通过各种分析手段，提取所建模型的特征及状态参数作为压缩输出。在解码时，依据这些特征或参数，通过模型及相关知识生成所建模型的信源。这类方法是把计算机视觉和计算机图形学的方法应用到图像编码。这类方法还可分为有先验知识的和无先验知识的两种。有先验知识的模型法是基于限定场景的图像编码，其中场景里的物体的三维模型是已知的;无先验知识的模型法是针对未知物体的图像编码，需要实时地构造物体的模型。有的文献称第一类方法为“语义基”图像编码，第二类方法为“物体基”图像编码。目前第一类模型法主要用于通信中人的头肩像编码。这主要由于可视电话、会议电视要在较低的传输速率下传输人物的运动图像，需要较大的压缩比，而经典的方法很难达到要求。在这种限定的场景中，可预先建立人物头部的三维模型，然后发送端提取头部的特征参数，将这些参数编码后传输到接收端。接收端用已知的三维模型和接收到的各种参数，用图像合成技术获得重建图像。这类模型法必须具备以下关键技术:①物头肩部三维模型的建立;②头部运动参数和表情参数的估值(即特征参数的提取);③图像的合成技术。第二类模型法由于不需要模式识别，其图像分析过程要简单得多。不过，这类方法没有充分利用景物的知识，其编码效率与第一类相比要差。这类模型法需要具备的关键技术有:①景物的分层次描述;②运动估值和运动分割。

(3)神经网络法。神经网络法是模仿人脑处理问题的方法，通过各种人工神经网络模型对数据进行非线性压缩。人工神经网络是一种非线性动态网络，工作过程一般分为训练和工作两个阶段。训练阶段就是使用一些训练图像和训练算法，调整网络的权重，使重建图像的误差最小。目前直接用于图像压缩的神经网络主要是BP网络。

(4)基于小波变换的编码。1984年由法国人Morlet提出的小波变换理论已受到人们的广泛关注，并成为图像编码领域最热门的研究课题之一。这类方法是用不同类型的一维或二维线性数字滤波器，对图像进行整体分解，然后根据人类视觉特性对不同频段的数据进行粗细不同的量化处理，因此能达到更好的压缩效果。这类方法原理上仍属于线性处理，属于“波形”编码，严格地说，可归入经典编码方法一类。但是，小波分析是近十年来发展起来的信号分析方法，小波变换的优点是它在时域和频域都具有良好的局部特性。而且，对不同频率成分的时域取样步长可调，高频部分对应小的取样步长，低频部分对应大步长，这是一种使用多尺度描述信号的分析方法。这一特性对于图像编码处理特别有意义，就像我们从不同距离观察图像，远处看到的是较大的纹理，近处看其细节，这也正符合了人的视觉信息处理过程，因而有“数学显微镜”之称。小波级数可在不同分辨率下逼近某一函数，实现多分辨率分解。这些优良性能，使基于小波变换的图像编码方法，在压缩性能上取得了突破性进展。小波变换方法的压缩比在100∶1以上时，图像质量仍然可观。鉴于它的这些先进性，本书将它归入现代编码方法行列。人脸图像的压缩和特征提取都是以小波变换为基础的，我们将在后面的章节中更详细地讨论。

现代编码方法充分利用了计算机图形学、计算机视觉、人工智能与模式识别等相关学科的研究成果，为图像压缩编码开拓了广阔的前景。但是，由于现代方法增加了分析的难度，所以，大大增加了实现的复杂性。从当前来看，现代编码方法仍处于深入研究阶段。例如，分形法由于图像分割、迭代函数系统代码的形成非常困难，因而实现起来时间长，算法十分复杂;模型法则仅限于人头像等基本的图像上，进一步的发展依赖于数学方法和其他相关学科的发展;神经网络法的工作机制至今仍不是很清楚，硬件研制不成功，所以在图像编码中应用研究进展缓慢，目前多与其他方法结合使用。但由于巨大压缩性能的潜力，人们仍以极大的热情致力于这些新方法的研究。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈