首页 百科知识 以增强人类认知为目标的信息可视化

以增强人类认知为目标的信息可视化

时间:2022-09-30 百科知识 版权反馈
【摘要】:周宁等认为“信息可视化是运用计算机图形或图像处理技术,将信息转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术”。因此,信息可视化是利用可视化方式展示信息结构、挖掘隐含在大量数据中的信息和知识,其基本目的是在大量数据中发现新的见解、增强认知。信息可视化模型则能反映信息可视化的本质特征。科学可视化的许多应用是三维数据的可视化,因为科学可视化的用途主要就是表示实际的三维物体。

1.3.1 以增强人类认知为目标的信息可视化

随着人机交互技术的发展、计算机处理能力的提高、计算机图形学的成熟,将可视化技术应用到非空间、非数值数据的图形化映射和转换成为可能。Card等(1999)人把信息可视化定义为:“使用计算机支撑的、交互性的可视化方式表示抽象数据以增强认知”。周宁等(2004)认为“信息可视化是运用计算机图形或图像处理技术,将信息转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术”。毕强等(2004)则认为“信息可视化是一门以计算机科学、地图学、认知科学、信息传播学与信息系统为基础,为直观、形象地表现、解释、传递空间信息并揭示其规律,关于信息表达、传播的理论、方法与技术的学科”。

因此,信息可视化是利用可视化方式展示信息结构、挖掘隐含在大量数据中的信息和知识,其基本目的是在大量数据中发现新的见解、增强认知。

1.3.1.1 信息可视化模型

模型是现实世界中的事物的抽象表示,通过建模可以揭示事物的本质特性、忽略次要因素。信息可视化模型则能反映信息可视化的本质特征。但从不同的角度出发,建立的信息可视化模型不尽相同。

信息可视化可以看成是从数据到可视化形式再到人的感知系统的可调节的映射。据此,Card等人(1999)提出了信息可视化参考模型,如图1-11所示。在该模型中,从原始数据到人,中间要经历一系列数据变换。图中从左到右的每个箭头表示一系列的变换;从右到左的箭头,表示用户的操作控制对这些变换的调整。数据变换把原始数据映射为数据表;可视化映射把数据表转换为可视化结构;视图变换通过定义位置、图形缩放、剪辑等图形参数创建可视化结构的视图;用户的交互动作则用来控制这些变换的参数,例如把视图约束到特定的数据范围,或者改变变换的属性等。

因此,信息可视化的本质是通过选择可视化数据并将其转换成可视化形式来展示信息结构、揭示隐含信息,主要经历数据准备、数据析取、可视化映射及视图变换等步骤,以服务于各种任务的完成,如信息检索、信息分析、信息计量及数据挖掘等。

img16

图1-11 信息可视化参考模型

按照媒体形式的不同,可以将信息资源分为文本信息资源、语音信息资源及视频信息资源,据此周宁提出了中文信息资源可视化模型,如图1-12所示。文本信息资源通过数字后转换成数字化文本文件,而语音信息资源通过语音识别转换成数字化文本文件;抽取数字化文本的特征,建立特征库;然后,利用图符库、词库进行可视化处理生成可视化模式。视频信息资源则直接进行特征值抽取建立特征库,并在知识库和索引库的支持下生成索引,最后进行可视化处理生成可视化模式。语音信息资源通过语音-文本转换,转化为文本信息资源可视化问题,而视频信息资源通过特征抽取提供可视化需要的原始数据。

中文信息资源可视化模型利用图、文、声的分类方法,建立了通用的汉语信息资源可视化模型,它强调各种数据库的建立,包括特征库、知识库、索引库、图符库、词库等,表明在可视化处理前,必须提供有效的原始数据供可视化处理模块生成可视化模式。

img17

图1-12 中文信息资源可视化模型

另外,比较有代表性的信息可视化模型还有:Chi(2000)从以数据为中心的观点出发,提出的信息可视化数据状态参考模型;Zhang P.(2000)以商业信息为对象建立的商业信息通用可视化模型;以及周宁等(2004)以集合论为基础建立的信息可视化系统的数学模型——信息可视化系统的RDV模型。

由于建模的出发点不相同,这些信息可视化模型并不完全一致。但它们的本质是一样的,认为信息可视化主要经过数据准备、数据析取、可视化映射及视图变换等步骤,即信息可视化的本质是通过选择可视化数据并将其转换成可视化形式来展示信息结构、揭示隐含信息,以服务于各种任务的完成,如信息检索、信息分析、信息计量、数据挖掘等。

1.3.1.2 信息可视化分类

按照数据类型的不同,可以将信息可视化分为一维数据的可视化、二维数据的可视化、三维数据的可视化、多维数据的信息可视化、时态数据的可视化、层次数据的可视化及网状数据的可视化7类(Shneiderman.B.1996)。

(1)一维数据的可视化

一维数据是简单的线性数据,如文本或数字表格。文本文档、姓名和地址表格以及许多日常处理的程序源代码都基于一维线性数据。文本文档是常见的一维数据。大多数情况下,用不着对文本文档进行可视化。因为人们只是将文本从头读到尾,或者在必要时,对有关部分进行参阅。不过在另一些情况下,我们可以充分发挥计算机和数字信息的功能,利用可视化增强一维数据文本文档的效用,以便用户浏览,或者通过链接将同一文档的不同部分联系在一起。

(2)二维数据的可视化

在信息可视化当中,二维数据是由在空间体现的两种主要属性构成的数据。比如,宽度和高度表示物体尺寸,而物体在X轴和Y轴上的位置表示空间方位。标明城市位置的地图、建筑物的楼层平面图以及文档库里面的一批相关文档都是二维数据的可视化实例。二维数据集里面的物体可能有两种以上属性,数据是不是二维数据,取决于数据由两种主要属性来描述,而不是属性的总数量。

(3)三维数据的可视化

三维数据比二维数据更进一层,它可以描述立体。科学可视化的许多应用是三维数据的可视化,因为科学可视化的用途主要就是表示实际的三维物体。计算机模型可以让科学家模拟实验、操作现实世界中价格昂贵、实施困难、非常危险甚至不可能完成的事情。近年来,三维数据的可视化应用于建筑和医学领域。

(4)多维数据的可视化

多维数据是描述有三种以上属性的物体的数据,每一种属性在视图上大体相同。例如,这里有某地所有房屋的价值和它们的地址数据清单,价值和地址信息均是一维数据,如果按照价值排序即是一维数据的可视化;也可以创建一个测度,用点的大小表示房子的相对价值,并且将点放置在地图上表示它们的地址,即是二维数据的可视化;如果有一个数据库,包括房子的一系列属性,如卧室数量、年代、面积等,如果可以根据任何一个属性来排序,就是多维数据的可视化了。

(5)时态数据的可视化

以图形方式显示随着时间不断产生的数据是可视化应用的最常见方式之一,并且在过去200年不断得到应用。近年来,时间线作为排列数据的基础已普遍出现在诸多商业软件当中。Microsoft Project等计划管理工具就是使用时间线,使用户一眼就能够看出事件前后发生时的持续情况以及哪些事件与其他事件相关。在多媒体创作软件(如Macromedia的Director和Flash)中,时间线为用户将一事件与另一事件实现同步提供了一种途径。

(6)层次数据的可视化

层次数据即树形数据就是有这样一种内在结构的数据:每个节点都有一个父节点(最上面的节点,即根节点除外)。节点分兄弟节点(拥有同一个父节点的节点)和子节点(从属某个父节点的节点)。例如,Windows系统的资源浏览器界面能够可视化显示计算机的目录结构,这样与使用基于文本的命令行界面相比,用户就能更快地了解结构,浏览到某个节点。

(7)网状数据的可视化

网状数据中的节点不受与其有关联的节点数量的约束(不像层次节点,它们都有唯一的父节点),网状数据没有固有的层次结构,两个节点之间可以有多条路径。节点与节点间的关系及其属性的数量都是可变的。因为属性和节点之间的关系可能非常复杂,如果不用某种可视化方法,网状数据很难显示。例如,因特网上有成千上万台服务器,服务器之间又可能存在众多路径。尽管对特定的任务而言,通过观察表格和统计数字就可以了解网络流量模式、使用量高峰和低峰以及节点之间的备用路径,但使用可视化方式却可以大大简化这项复杂工作。

1.3.1.3 信息可视化技术

从功能上出发,信息可视化技术可以分为:用于绘制空间结构的展示技术和用于优化空间布局的交互技术。

(1)展示技术

绘制空间结构中最为常见的布局算法主要有层次结构和网络结构两种。

较为广泛的是层次展示技术,包括Cone Tree、Hyper Tree、Space Tree、Treemap等,如图1-13所示

网状展示技术包括力导向算法、Radial Graph、寻径网络、自组织地图等,如图1-14所示。

img18

(a)Cone Tree

img19

(b)Hyper Tree

img20

(c)Space Tree

img21

(d)Treemap

图1-13 层次展示技术

img22

(a)力导向算法

img23

(b)Radial Graph

img24

(c)寻径网络

img25

(d)自组织地图

图1-14 网状展示技术

(2)交互技术

在有限的屏幕上显示复杂的信息结构时,显示更多的低层次细节还是更多的高层次上下文信息之间是相互矛盾的。用户不仅要能轻松观察对象的局部细节,也要轻松了解帮助其定位的全局信息。问题解决的关键在于怎样折中屏幕细节信息和全局信息的显示,怎样分配有限的屏幕空间,即是要弄清楚哪些需要优先显示,哪些需要大面积显示。解决方法主要有三种:①概览+细节视图,分别在两个视图中显示全局和细节信息,例如Windows系统的资源浏览器;②多比例缩放,允许用户根据不同层次的信息需要,自由放大、缩小,例如Treemap工具便允许用户在不同的层次结构中自由导航;③焦点+上下文视图,在几何失真视图中显示局部细节和全局信息,焦点区域以较好的比例显示,边缘区域以粗糙的比例显示,例如Hyper Tree和RadialGraph的设计体现了焦点+上下文视图的应用。

信息可视化技术的发展过程中面临主要问题包括:计算机处理能力与人类理解能力之间的矛盾、局部细节与全局信息之间的矛盾、全局观点与复杂度之间的矛盾、结构与内容之间的矛盾、灵活性与一致性之间的矛盾、双向关系与动作反转之间的矛盾、技术创新与熟悉隐喻之间的矛盾等(Julia Ahlers,2002)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈