首页 百科知识 多媒体技术数据压缩方法

多媒体技术数据压缩方法

时间:2022-06-22 百科知识 版权反馈
【摘要】:多媒体技术的特性主要包括信息载体的多样化、数字化、集成性、交互性和实时性5个方面,这是多媒体的主要特性。

第四节 多媒体技术

一、媒体和媒体信息

媒体(media)是指信息表示和传播的载体,其中包括了两层含义:一是指信息的物理载体(即存储和传递信息的实体),如书本、磁盘、光盘、磁带以及相关的播放设备等;另一层是指信息的表现形式,如文字、声音、图像、动画等。媒体一般分为感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体5类。多媒体计算机中所说的媒体,是指计算机不仅能处理文字、数值之类的信息,而且还能处理声音、图形、图像等各种不同形式的信息。目前这类信息主要包括文本、图形、静态图像、动画、声频和视频等。

1.文本(text)

文本是指以文字和各种专用符号表达的信息形式,是现实生活中使用最多的一种信息存储和传递方式。它主要用于对知识的描述性表示,如阐述概念、定义、原理和问题以及显示标题、菜单等内容。文本文件格式常用的有.TXT,.DOC,.RTF以及.DOT等。

2.图形(graphic)

图形是指用计算机绘制的从点、线、面到三维空间的黑白或彩色几何图。由于图形文件中只记录生成图的算法和图上的某些特征点(大小、形状及位置、维数等),故称矢量图形。其优点是能分别控制处理图中各部分,如图形移动、放大、扭曲而不失真,不同物体可在屏幕上重叠并保持各自特征,必要时仍可分开独立显示。主要用于表示线框形的图画、工程制图、美术字等。与图像相比,图形所占用的存储空间较小,但显示速度较慢。常用的矢量图形文件有.3DS,.DXF,.WMF等。

3.图像(image)

图像是指由输入设备捕捉的实际场景画面,或以数字化形式存储的任意画面。静止的图像可用矩阵来描述,其元素代表空间的一个点,称之为像素(pixel),整幅图像就是由一些排成行列的像素点组成的,故称为位图。位图中的位用来定义图中每个像素点的颜色和亮度。对于黑白图常用1位值表示,对于灰度图常用4/8位表示该点亮度,而彩色图像则有多种描述方法。位图适合于表现层次和色彩比较丰富、包含大量细节的图像,具有灵活和富于创造力等特点。图像的关键技术是图像的扫描、编辑、压缩、快速解压和色彩一致性再现等。进行图像处理时一般要考虑3个因素:分辨率、图像深度与显示深度、图像数据容量。常用的图像文件格式有.BMP,.PCX,.TIF,.TGA,.GIF,.JPG等。

4.动画(animation)

动画是指利用人的视觉暂留特性,快速播放一系列连续运动变化的图形图像,也包括画面的缩放、旋转、变换、淡入淡出等特殊效果。计算机设计动画的方法有两种:一种是造型动画,每帧由图形、声音、文字、调色板等造型元素组成,对每一个运动主体分别进行设计,赋予每个主体一些特征,如大小、形状、颜色等,然后用这些主体构成完整的帧画面;另一种是帧动画,由一幅幅位图组成的连续画面就像电影胶片或视频画面一样,要分别设计每屏要显示的画面。常用的动画文件主要有.FLA和.MMM两种。

5.声频(audio)

用计算机处理声音,是把任何声音都进行采样量化后保存,并恰当地恢复出来,相应的文件格式是.WAV,.MID,.VOC。

声音通常用一种模拟的连续波形表示。波形描述了空气的振动,波形最高点(或最低点)与基线间的距离为振幅,表示声音的强度。波形中两个连续波峰间的距离称为周期。波形频率由1秒内出现的周期数决定。通过采样可将声音的模拟信号数字化,即在捕捉声音时以固定的时间间隔对波形进行离散采样。这个过程将产生波形的振幅值,以后这些值可重新生成原始波形。影响数字声音波形质量的主要因素有:采样频率,指波形被等分的份数,采样频率越高,质量越好;采样精度,即每次采样的信息量;通道数,指声音产生的波形数,一般分为单声道(产生一个波形)和立体声道(产生两个波形)。计算机音频技术主要包括声音的采集、无失真数字化、压缩/解压缩以及声音的播放。

6.视频(video)

若干有联系的图像数据连续播放便形成了视频。视频影像具有时序性与丰富的信息内涵。计算机视频是数字的,视频图像可来自录像带、摄像机等。

模拟视频(如电影)和数字视频都是由一系列静止画面组成的,这些静止的画面称为帧。一般来说,如果帧率低于15帧/秒,则连续运动视频就会有停顿的感觉。我国采用的电视标准是PAL制,它规定视频为每秒25帧(隔行扫描方式),每帧625个扫描行。当计算机对视频进行数字化时,就必须在规定的时间内完成量化、压缩和存储等多项工作。视频文件的使用一般与标准有关,主要有AVI,MOV,MPG,DAT,DIR等。在视频中有以下几个技术参数。

(1)帧速:指每秒钟顺序播放多少幅图像。根据电视制式不同有30帧/秒、25帧/秒等。

(2)数据量:若不经过压缩,数据量是帧速乘以每幅图像的数据量。假设一幅图像为1MB,帧速为30帧/秒,则每秒所需数据量将达到30MB。但经过压缩后可减小几十倍甚至更多。

(3)图像质量:除了原始数据的质量外,还与对视频数据压缩的倍数有关。一般来说,压缩比较小时对图像质量不会有太大影响,而超过一定倍数后,将会明显看出图像质量下降。

二、多媒体技术及特点

多媒体(multimedia)是指能够同时获取、处理、编辑、存储和展示两个以上不同类型信息媒体的技术,人们现在常说的“多媒体”不是指其本身,而主要是指处理和应用它的一整套技术。因此,“多媒体”实际上常被当作“多媒体技术”的同义语。

多媒体技术不是各种信息媒体的简单复合,它是把指文字、音频、视频、图形、图像、动画等多媒体信息通过计算机进行数字化采集、获取、压缩/解压缩、变换、传输、编辑、存储、播放、显示等加工处理,然后以单独或合成形式表现出来的一体化技术。多媒体技术的特性主要包括信息载体的多样化、数字化、集成性、交互性和实时性5个方面,这是多媒体的主要特性。

三、多媒体计算机系统

多媒体计算机系统不是单一的技术,而是多种信息技术的集成,是把多种技术综合应用到一个计算机系统中,实现信息输入、信息处理、信息输出等多种功能。一个完整的多媒体计算机系统由多媒体计算机硬件和多媒体计算机软件两部分组成。

1.多媒体计算机的硬件

多媒体计算机的主要硬件除了常规的硬件如主机、软盘驱动器、硬盘驱动器、显示器、网卡之外,还要有音频信息处理硬件、视频信息处理硬件及光盘驱动器等部分。

(1)音频卡:用于处理音频信息,它可以把话筒、录音机、电子乐器等输入的声音信息进行模数转换(A/D)、压缩等处理,也可以把经过计算机处理的数字化的声音信号通过还原(解压缩)、数模转换(D/A)后用音箱播放出来,或者用录音设备记录下来。

(2)视频卡:用来支持视频信号(如电视)的输入与输出。

(3)采集卡:能将电视信号转换成计算机的数字信号,便于使用软件对转换后的数字信号进行剪辑处理、加工和色彩控制。还可将处理后的数字信号输出到录像带中。

(4)扫描仪:将摄影作品、绘画作品或其他印刷材料上的文字和图像,甚至实物,扫描到计算机中,以便进行加工处理。

(5)光驱:用于读取或存储大容量的多媒体信息,分为只读光驱(CD ROM)和可读写光驱(CD RW),可读写光驱又称为刻录机。

2.多媒体计算机的软件

多媒体软件技术主要包括多媒体操作系统、多媒体素材采集与制作技术、多媒体编辑与创作技术等。

(1)多媒体操作系统:多媒体操作系统是多媒体软件的核心。它负责多媒体环境下多任务的调度、保证音频、视频同步控制以及信息处理的实时性,提供多媒体信息的各种基本操作和管理,具有对设备的相对独立性与可扩展性。Windows,OS/2和Macintosh操作系统都提供了对多媒体的支持。

(2)多媒体素材采集与制作技术:素材的采集与制作主要包括采集并编辑多种媒体数据,如声音信号的录制、编辑和播放;图像扫描及预处理;全动态视频采集及编辑,动画合成编辑;音/视频信号的混合和同步等。同时还涉及相应的媒体采集、制作软件的使用问题。

(3)多媒体编辑与创作工具:多媒体编辑与创作工具是供特定应用领域的专业人员组织编排多媒体数据,并把它们连接成完整的多媒体应用系统的工具。它是多媒体专业人员在多媒体操作系统之上开发的,这些创作工具可用于影视系统的动画制作及特技效果,也可用于培训、教育和娱乐节目制作及商业简介、家庭学习材料的编辑。

四、多媒体关键技术

在开发多媒体应用系统中,要使多媒体系统能交互综合处理和传输数字化的声音文字、图像信息,实现面向三维图形、立体声音、彩色全屏幕运动画面的技术处理和传播的效果,它的关键技术是要进行数据压缩、数据解压缩,生产专用芯片、解决大容量信息存储等问题。

1.视频音频数据压缩解压缩技术

由于数字化的图像、声音等媒体数据量非常大,致使在目前流行的计算机产品,特别是PC系列上开展多媒体应用难以实现。例如,未经压缩的视频图像处理时的数据量每秒约28MB,播放1分钟立体声音乐也需要100MB存储空间。视频与音频信号不仅需要较大的存储空间,还要求较快的传输速度。因此,既要对数据进行压缩和解压缩的实时处理,又要进行快速传输处理。因此,必须对多媒体信息进行实时压缩和解压缩。目前,视频编码的国际标准有如下所述。

(1)静止图像压缩标准JPEG:国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立的“联合照片专家组”JPEG(join photographic experts group)于1991年提出了“多灰度静止图像的数字压缩编码”(简称JPEG标准),这是一个适应于彩色和单色多灰度或连续色调静止数字图像的压缩标准,可支持很高的图像分辨率和量化精度。它包含两部分:第一部分是无损压缩,基于差分脉冲编码调制的预测编码,不失真但压缩比很小;第二部分是有损压缩,基于离散余弦变换和Human编码,有失真但压缩比大。

(2)运动图像压缩标准MPEG:在1990年形成的一个标准草案MPEG(moving picture experts group)是视频图像压缩的一个重要标准,它兼顾了JPEG标准和CCITT专家组的H.261标准,其中于1992年通过的MPEG 1标准是针对传输速率为1~1.5MB/s的普通电视质量的视频信号的压缩;MPEG 2的目标则是对每秒30帧的720×572分辨率的视频信号进行压缩,在扩展模式下,MPEG 2可以对分辨率达1 440×1 152高清晰电视的信号进行压缩。

MPEG标准分成MPEG视频、MPEG音频和MPEG系统3大部分。MPEG视频是面向位速率为1.5MB/s的视频信号的压缩;MPEG音频是面向通道速率为64KB/s,128KB/s和192KB/s的数字音频信号的压缩;MPEG系统则要解决对音频、视频多样压缩数据流的复合和同步的问题。

MPEG算法大大提高了视频图像的压缩比,在保持较高的图像视觉效果的前提下,压缩比可达到60~100倍。但MPEG压缩算法复杂、计算量大,其实现一般要有专门的硬件支持。

(3)视频通信编码标准H.261/H.263:多媒体通信中的电视图像编码标准都采用H.261和H.263。H.261主要用来支持电视会议和可视电话,并于1992年开始应用于综合业务数字网络(ISDN),该标准采用帧内压缩和帧间压缩技术,可使用硬件或软件来执行。电视图像数据压缩后的数据速率为P×64KB/s,其中P是一个可变参数,取值范围是1~30,所以,H.261建议的最低传输率是64KB/s。H.263是在H.261的基础上开发的电视图像编码标准,用于低位速率通信的电视图像编码,目标是改善在调制解调器上传输的图像质量,并增加了对电视图像格式的支持。

2.多媒体专用芯片技术

专用芯片是多媒体计算机硬件体系结构的关键。因为,要实现音频、视频信号的快速压缩、解压缩和播放处理,需要大量的快速计算。而实现图像的许多特殊效果(如改变比例、淡入淡出、马赛克等)、图形的处理(图形的生成和绘制等)、语音信号处理(抑制噪声、滤波)等,也都需要较快的运算和处理速度。因此,只有采用专用芯片,才能取得满意的效果。

多媒体计算机专用芯片可归纳为两种类型:一种是固定功能的芯片,另一种是可编程的数字信号处理器(DSP)芯片。DSP芯片是为完成某种特定信号处理设计的,在通用机上需要多条指令才能完成的处理,在DSP上可用一条指令完成。

3.大容量信息存储技术

多媒体的音频、视频、图像等信息虽经过压缩处理,但仍然需要相当大的存储空间。而且硬盘存储器的盘片是不可交换的,不能用于多媒体信息和软件的发行。大容量只读光盘存储器(CD ROM)的出现,解决了多媒体信息存储空间及交换问题。光盘机以存储量大、密度高、介质可交换、数据保存寿命长、价格低廉以及应用多样化等特点成为多媒体计算机中必不可少的设备。

4.多媒体输入与输出技术

多媒体输入与输出技术包括媒体变换技术、媒体识别技术、媒体理解技术和综合技术。媒体变换技术是指改变媒体的表现形式,如视频卡、声卡;媒体识别技术是对信息进行一对一的映像过程,如语音识别;媒体理解技术是对信息进行更进一步的分析处理和理解信息内容,如自然语言理解、模式识别等技术;媒体综合技术是把低维信息表示映像成高维的模式空间的过程,如语音合成器就可以把语音的内部表示综合为声音输出。

5.多媒体通信技术

要求能够综合地传输、交换各种信息类型,包含语音压缩、图像压缩及多媒体的混合传输技术。为了只用一根电话线同时传输语音、图像、文件等信号,必须要用复杂的多路混合传输技术,且要采用特殊约定来完成。现有通信网基本不适应数字化多媒体数据的传输。目前宽带综合业务数字网(B ISDN)是解决这个问题的一个比较完整的方法。

五、多媒体应用与发展

1.多媒体技术的应用

目前的多媒体硬件和软件已经能将数据、声音,以及高清晰度的图像作为窗口软件中的对象去做各式各样的处理,它所出现的各种丰富多彩的多媒体应用不仅使原有的计算机技术锦上添花,而且将复杂的事物变得简单,把抽象的东西变得具体。就目前而言,多媒体技术已在商业、教育培训、电视会议、声像演示等方面得到了充分应用。

(1)在教育与培训方面的应用:多媒体技术对教育产生的影响比对其他的领域的影响要深远得多。它改变了传统的教学方式,利用多媒体计算机的文本、图形、视频、音频及其交互性特点,可以编制出计算机辅助教学软件(课件),其具有生动形象、人机交流、及时反馈等特点,能创造出生动逼真的教学环境,改善学习效果。

(2)在通信方面的应用:多媒体通信有着极其广泛的内容,如可视电话、视频会议已被逐步采用,而信息点播(information demand)和计算机协同工作(computer supported cooperative work,简称CSCW)系统将给人类的生活、学习和工作带来深刻的影响。

同时,多媒体技术也给出版业带来了巨大的影响,其中近年来出现的电子出版物就是多媒体技术应用的产物。利用多媒体技术还可为各类咨询提供服务,如旅游、邮电、交通、商业、金融、宾馆等。总之,多媒体技术的应用非常广泛,它既能覆盖计算机的绝大部分应用领域,同时也拓展了新的应用领域,它将在各行各业中发挥出巨大作用。

2.多媒体技术的发展方向

未来的多媒体技术将向着以下6个方向发展:高分辨率,提高显示质量;高速度化,缩短处理时间;简单化,便于操作;高维化,三维、四维或更高维;智能化,提高信息识别能力;标准化,便于信息交换和资源共享。

复习思考题

一、选择题

1.将程序像数据一样存放在计算机内存中运行,是1946年由提出的。

A.图灵 B.布尔 C.冯·诺依曼 D.爱因斯坦

2.最先实现存储程序的计算机是。

A.ENIAC B.EDVAC C.EDSAC D.UNIVA

3.微处理器研制成功的时间是年。

A.1946 B.1965 C.1971 D.1978

4.网络协议的主要要素为。

A.数据格式、编码、信号电平 B.数据格式、控制信息、速度匹配

C.语法、语义、同步 D.编码、控制信息、同步

5.在星型局域网结构中,连接文件服务器工作站的设备是。

A.调制解调器 B .交换器 C.路由器 D.集线器

6.在OSI 7层结构模型中,处于数据链路层与运输层之间的是。

A.物理层 B.网络层 C.会话层 D.表示层

二、简答题

1.简述OSI参考模型。

2.什么是IP地址

3.数据管理经过了哪几个阶段?

4.多媒体技术的特点是什么?

5.简述计算机系统的组成。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈