首页 百科知识 以机器处理为中心的可视化展示

以机器处理为中心的可视化展示

时间:2022-09-30 百科知识 版权反馈
【摘要】:原始数据空间是由需要进行可视化展示的原始数据构成的数据空间,是通过筛选、采集知识库中的相关数据并进行格式化、结构化处理形成的。可视化数据空间是由需要进行可视化展示的数据结构构成的数据空间,是利用模式识别、数据挖掘、知识挖掘等技术对原始数据空间进行处理形成的特征数据空间,具有一定的模式结构,能够直接映射到视觉对象空间。

2.4.1 以机器处理为中心的可视化展示

可视化展示是将抽象的数据空间转换为直观的视觉空间,以便于人们通过强大的视觉处理能力发现隐藏在抽象数据空间中的模式、见解和知识。可视化展示流程如图2-21所示,包括数据准备、数据析取以及数据映射三个步骤,三个步骤分别形成原始数据空间、可视化数据空间以及视觉对象空间。

img80

图2-21 可视化展示流程

原始数据空间是由需要进行可视化展示的原始数据构成的数据空间,是通过筛选、采集知识库中的相关数据并进行格式化、结构化处理形成的。原始数据空间可以是关系数据库中一组表格,也可以是一系列XML文档,还可以是其他结构化数据。原始数据空间的形成通过自动采集实现,关键技术是信息抽取和自动标引。知识库中存取的知识数量巨大、内容丰富、格式繁杂、结构化程度不一,有HTML、XML、XHTML等Web文档,有PDF、DOC、TXT、CAJ等文本文档,有JPG、BMP、MP3、WMV、AVI、RMVB、VOB等多媒体文档,有关系数据库中的表格。如何对这些文档进行格式转换形成结构化的数据源是数据准备的关键任务,对于Web需要内容解析,对于图像型文本文档需要文字识别,对于语音信息需要语音识别,对于数据库表格需要进行模式转换。

可视化数据空间是由需要进行可视化展示的数据结构构成的数据空间,是利用模式识别、数据挖掘、知识挖掘等技术对原始数据空间进行处理形成的特征数据空间,具有一定的模式结构,能够直接映射到视觉对象空间。可视化数据空间最为典型的两种数据结构是树状结构和网状结构。思维导图可以用一棵树表示,概念图可以用一幅图表示。可视化数据空间中的数据结构在计算机中可以以数据表形式存储,可以以XML文档格式存储,计算时转换为链表结构或向量矩阵。对于汉语信息而言,可视化数据空间生成的基础技术是汉语分词技术,汉语词语之间既无特殊的空格也无特殊的间隔标志,词之间没有明显的形态界限。对于汉语信息进行文本挖掘时常常在词语层次完成,例如自动分类、自动聚类、内容分析等均需要建立相应的词空间。

视觉对象空间是由一组视觉对象及其属性构成的用户界面,是利用布局算法、填充算法、交互设计算法以及优化算法对可视化数据空间进行映射和渲染形成的,直接呈现给用户供其查看和操作。视觉对象可以是各种具有交互功能的图形,如Windows资源浏览器、Space Tree、Treemap、theBrain概念图等。常用的视觉属性包括位置、形状、方向、色彩、纹理、灰度等级及尺寸等。在数据映射时,常常将可视化数据空间的数据关系映射为整体的视觉对象,将每个数据元素映射为视觉对象的某个属性。例如,在将一个知识分类目录进行可视化映射时,整个分类目录映射为一个树结构,每个类目映射为一个树节点,类目之间的类属关系映射为树节点之间的关系;而每个类目的属性映射为树节点的视觉属性。如将每个类目下的文档数量映射为节点的灰度等级,越深表示文档数量越多。数据映射的关键技术是图形布局和人机交互

可视化展示的实质是将抽象的数据空间映射到直观的视觉空间,在整个过程中,所有任务主要由计算机自动完成,人类仅是参与其中。数据准备阶段,计算机根据识别算法、抽取算法、标引算法将需要的数据源从知识库中采集出来,用户的主要操作是选择合适算法以及指定相应参数;数据析取阶段,计算机根据一定的挖掘算法从原始数据空间中发现合理的模式和结构,用户的主要操作依然是选择算法和指定参数;数据映射阶段,计算机根据布局算法、交互算法将可视化数据空间中的数据结构映射为直观的视觉对象,用户的主要操作是指定参数以及根据需要进行交互控制,用户给定指令后计算机重新计算更新视觉对象。因此,可视化展示充分利用了计算机强大处理能力,将抽象的数据直观化、形象化,让人类更为方便地查看和利用知识。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈