首页 理论教育 数据压缩技术

数据压缩技术

时间:2022-03-05 理论教育 版权反馈
【摘要】:相比之下,语音的数据量较小,且基本压缩方法已经成熟,目前的数据压缩研究主要集中于图像和视频信号的压缩方面。数据压缩,通俗地说,就是用最少的数码来表示信号。由此看来,通信时间、传输带宽、存储空间甚至发射能量,都可能成为数据压缩的对象。数据压缩方法种类繁多,可以分为无损压缩和有损压缩两大类。下面介绍三种流行的数据压缩国际标准。我国在发展数据压缩技术过程中,则充分利用了软件人才优势。

4.2.1 数据压缩技术

各种媒体信息(特别是图像和动态视频)数据量非常之大。例如:一幅640×480分辨率的24位真彩色图像的数据量约900kB;一个100MB的硬盘只能存储约l00幅静止图像画面。NTSC标准的帧速率为30帧/秒,视频信号的传输率约为26.4Mb/s,远远高于计算机的数据传输速率。对于音频信号,激光唱盘(CD-DA)的采样频率为44.lkHz,量化位数为16位,双通道立体声,100MB硬盘仅能存储约10分钟录音。目前CD-ROM数据传输率单速的约为150kb/s(倍速为300kb/s,最先进的3倍速或4倍速驱动器可以达到450kb/s以上),远不能达到传输要求。显然,这样大的数据量不仅超出了计算机的存储和处理能力,更是当前通信信道的传输速率所不及的。因此,为了存储、处理和传输这些数据,必须进行压缩。相比之下,语音的数据量较小,且基本压缩方法已经成熟,目前的数据压缩研究主要集中于图像和视频信号的压缩方面。

(1)什么是数据压缩

数据压缩,通俗地说,就是用最少的数码来表示信号。其作用是:能较快地传输各种信号,如传真、Modem通信等;在现有的通信干线并行开通更多的多媒体业务,如各种增值业务;紧缩数据存储容量,如CD-ROM、VCD和DVD等;降低发信机功率,这对于多媒体移动通信系统尤为重要。由此看来,通信时间、传输带宽、存储空间甚至发射能量,都可能成为数据压缩的对象。

(2)数据压缩的分类

数据压缩方法种类繁多,可以分为无损压缩和有损压缩两大类。无损压缩利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到数据统计冗余度的理论限制,一般为2∶1~5∶1。这类方法广泛用于文本数据、程序和特殊应用场合的图像数据(如指纹图像、医学图像等)的压缩。由于压缩比的限制,仅使用无损压缩方法不可能解决图像和数字视频的存储和传输问题。有损压缩方法利用了人类视觉对图像中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息,虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响较小,却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。

(3)数据压缩的方法及标准

在多媒体应用中常用的压缩方法有:PCM(脉冲编码调制)、预测编码、变换编码(主成分变换或K-L变换、离散余弦变换MT等)、插值和外推法(空域亚采样、时域亚采样、自适应)、统计编码(Huffman编码、算术编码、Shannon-Fano编码、行程编码等)、矢量量化和子带编码等;混合编码是近年来广泛采用的方法。新一代的数据压缩方法,如基于模型的压缩方法、分形压缩和小波变换方法等也已经接近实用化水平。

经常使用的无损压缩方法有Shannon-Fano编码、Huffman编码、游程(Run-length)编码、LZW编码(Lempel-Ziv-Welch)和算术编码等。

数据压缩研究中应注意的问题是:首先,编码方法必须能用计算机或VLSI硬件电路高速实现;其次,要符合当前的国际标准。下面介绍三种流行的数据压缩国际标准。

●JPEG——静止图像压缩标准

国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组JPEG(Joint Photographic Experts Group)经过五年艰苦细致地工作后,于1991年3月提出了ISO CDIO918号建议草案:多灰度静止图像的数字压缩编码(通常简称为JPEG标准)。这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。它包括基于DPCM(差分脉冲编码调制)、DCT(离散余弦变换)和Huffman编码的有损压缩算法两个部分。前者不会产生失真,但压缩量很小;后一种算法进行图像压缩是信息虽有损失但压缩比可以很大,例如压缩20倍左右时,人眼基本上看不出失真。

●MPEG——运动图像压缩编码

MPEG(Moving Picture Perts Group)是ISO/IEC/JTC/SC2/WG11的一个小组。它的工作兼顾了JPEG标准和CCITT专家组的H.261标准,于1990年形成了一个标准草案。MPEG标准分成两个阶段:第一个阶段(MPEG-1)是针对传输速率为lMb/s到l.5Mb/s的普通电视质量的视频信号的压缩;第二个阶段(MPEG-2)目标则是对每秒30帧的720×572分辨率的视频信号进行压缩,在扩展模式下,MPEG-2可以对分辨率达1440×1152高清晰度电视(HDTV)的信号进行压缩。

●H.261——视频通信编码标准

电视电话/会议电视的建议标准H.261常称为P×64K标准,其中P是取值为1~30的可变参数。P=l或2时支持四分之一中间格式(QCIF:Quarter Cmmon Intermedia Format)的帧率较低的视频电话传输。P≥6时支持通用中间格式(CIF:Common Intermediate Format)的帧率较高的电视会议数据传输。P×64K视频压缩算法也是一种混合编码方案,即基于DCT的变换编码和带有运动预测差分脉冲编码调制(IDPCM)的预测编码方法的混合。在低传输速率时(P=l或2,即64bit/s或128kbit/s),除QCIF外还可使用亚帧(Sub-frame)技术,即每间隔一帧(或数帧)处理一帧,压缩比可高达50∶1左右。

图像压缩技术、视频技术与网络技术相结合的应用前景十分可观,如远程图像传输系统、动态视频传输——可视电话、电视会议系统等已经开始商品化,MPEG标准与视频技术相结合的产物——家用数字视盘机和Video CD系统等都已进入市场。

(4)数据压缩的实现

在各种数据类型中,最难实现的是数字视频的实时压缩,因为视频信号尤其是HDTV信号所占据的带宽甚宽,实时压缩需要很高的处理速度。现在,视频解码以及音频的编码、解码多依赖于专用芯片数字信号处理器(DSP)来完成,并已有许多厂商推出了音视合一的单片MPEG-1、MPEG-2解码器。我国在发展数据压缩技术过程中,则充分利用了软件人才优势。在软件实现方面,由于PC主机的处理能力正在飞速提高,直接利用主CPU编程实现各种视听压缩和解码算法对于桌面系统及家用多媒体将越来越有吸引力。1996年上半年,Intel向全球软件界发布了它的微处理器媒体扩展(MMX)技术。这种技术主要是在Pentium或Pentium Pro芯片中增加了8个64位寄存器和57条功能强大的新指令,以提高多媒体和通信应用程序中某些计算密集的循环速度。MMX采用单指令多数据(SIMD)技术并行处理多个信号采样值,可使不同的应用程序性能成倍提高。如:视频压缩可提高1.5倍,图像处理可提高40倍,音频处理可提高3.7倍,语音识别可提高1.7倍,三维动画可提高20倍。与Pentium完全兼容的P55C芯片是1998年3月正式推出的。以后推出的Pentium、Pentium Pro或P7等CPU,均支持MMX指令。在数据压缩的硬件实现方面,根本的出路是要有自己的音像压缩芯片(特别是解压芯片),不管是用专用集成电路(ASIC)实现,还是借助于通用DSP来编程。而这一类芯片,目前还只是“雾里看花”。不过我们相信,在不久的将来,这些都会成为现实。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈