视觉认知论

时间：2022-02-01 理论教育版权反馈

【摘要】：所以视觉运动处理研究对时空地学可视化具有非常重要的意义。确切地说，视觉感知以模式识别为基础，视觉模式识别把图标记忆中的信息与LTVM中的信息相匹配。STVM被称为视觉缓冲区，可以被图标记忆或LTVM激活，经过“排演”的信息不被延迟地送到LTVM中。2．人类信息处理的计算模型在过去的20多年中，构造人类信息处理的计算模型是认知心理学的一个重要领域，大量研究被集中在视觉感知的人类神经模型上。

视觉认知论_地学三维可视化与

在人与计算机进行交互时，视觉是用户使用的主要感官。人的视觉系统能完成许多复杂的信息处理功能。视觉问题是一个复杂的问题，对视觉的研究需要探索这样一些问题：视觉系统如何获得图像丰富的信息，如何进行压缩编码，又如何在大脑中表示这些信息，最后又如何做出决策和行为。视觉运动处理研究表明人脑有运动处理的特长，并可通过训练来增强（Peterson，1994）。因此人们对动态现象的理解较容易，对静态现象的理解则相对困难。所以视觉运动处理研究对时空地学可视化具有非常重要的意义。

1．人脑对信息的处理（认知）模型

认知心理学运用信息加工的观点来研究认知活动，其研究范围主要包括知觉、注意、表象、学习、记忆、思维和语言等心理过程。一种认知心理学理论认为人脑对信息处理由感官记录（Sense Record）、短期记忆（Short Time Memory）、长期记忆（Long Time Memory）三个记忆存储组成。在视觉信息处理中，这三种记忆存储被称为图标记忆（Iconic Memory）、短期视觉记忆（STVM）和长期视觉记忆（LTVM）。

人类视觉信息处理是从图标记忆开始的，信息存储在感官中大约有500ms，足够感官用来进行初始识别。图标记忆是视网膜上的一种自然图像，视网膜具有无限制的能力并且不受模式复杂性的影响。把信息从图标记忆阶段转到STVM需要使用注意力，也就是人类辨别特殊信息排除其他信息的能力，这种能力以LTVM中存储的信息为基础。LTVM信息被用来猜测所看到的是什么，这种猜测可以控制注意力的过程。确切地说，视觉感知以模式识别为基础，视觉模式识别把图标记忆中的信息与LTVM中的信息相匹配。目前主要有三个模式识别模型：模板匹配、特征检测和符号描述。STVM被称为视觉缓冲区，可以被图标记忆或LTVM激活，经过“排演”的信息不被延迟地送到LTVM中。LTVM被称为长期仓库，其中的信息是不会被丢失的，所谓“遗忘”只不过是信息检索出了问题。

认知是一个信息获取、选择和存储的复杂过程。这一过程可以用图2-11的模型来表达。人们周围环境中的信息通过人的不同感觉器官来获取和选择，这些信息主要由声音、语言等听觉信息和图形图画等视觉信息构成。选择后的信息被送到短期记忆中，短期记忆由控制机制、声音语言存储器和视觉信息存储器构成。短期记忆的容量是有限的，一般只能同时处理7±2个项目，如果信息没有被增加或没有被重复，这些信息在几秒钟之后被控制机制消除；经过重复和促进的信息则被送到长期记忆中，声音语言信息创建一个文本基础，视觉信息则创建一个类似图画的基础，两种信息的处理过程形成一个双编码系统。两种编码后的信息随后被集成为思维模型或称为心像模型。思维模型能够处理各种信息之间的关系，它的形成与个人记忆中的现有知识和联系点（Contact Point）有关，现有知识和联系点越多，思维模型则越容易被集成到长期记忆中去，现有知识可以促进思维模型的形成，长期记忆中的信息也通过思维模型来促进。

图2-11 人的认知过程（信息处理）模型

（据Hasebrook，1995）

值得一提也很有意义的是，明显的证据说明位置信息在LTVM中是不需要注意力和意识的，虽然我们可能有意识地来了解这种信息，但却不可能有目的地把这些信息送到记忆中去。

2．人类信息处理的计算模型

在过去的20多年中，构造人类信息处理的计算模型是认知心理学的一个重要领域，大量研究被集中在视觉感知的人类神经模型上。这种模型有神经模糊性特点，可以提供一种机制来模拟视觉信息处理的并行算法，很多心理学家提出了自己的理论，Marr理论是其中一个比较有特色的理论。

Marr（1982）认为感知是以“世界是真实的”假定为基础的，这些假定具体包括“表面是光滑的”，视觉系统不是从经验中发现的，而是生来就有的。观察Marr理论的一个重要部分是从视网膜上的图像信息中构造大量不同的再现（Representation）。第一个再现阶段称为“最初框架”，主要获取视网膜图像的二维结构；第二个阶段称为“2．5D框架”，描述平面是如何导向的；最后一个阶段称为“3D模型”，用以构建空间目标的三维形状。在这一理论的基础上， Marr and Nishihara（1988）提出了目标识别理论，认为目标及其组成部分可以由无特点的圆锥体或柱体构成，其各自的长度及轴的排列可用于目标识别，从视网膜上获得圆锥体或圆柱体的外观与不同目标种类相匹配，根据目标组成部分的数目和排列来区分所观察的目标。

3．表象研究

表象（Mental Image）由记忆表象和想象表象构成。心理学将表象和知觉联系在一起，把已经存储（记忆中）的知觉信息的再现称为记忆表象，将经过加工改造而形成的新的形象称为想象表象。为了充分揭示表象的特殊性和机制，心理学家考察了有关“心理旋转”和“心理扫描”等具体的表象研究。

（1）表象的“心理旋转”实验：20世纪70年代，Shepard及其同事开展了“心理旋转”的研究。将计算机生成的三维图形对（图2-12）呈现给被试者，被试者的任务是判定两个图形是否相同。图形对有三种情况，一是两个图形相同而方位不同，其中一个相对于另一个在平面（纸张）上转动了一定角度［图2-12（a）］，称为平面对；第二种情况是图形相同，但其中一个相对于另一个在与纸张垂直的平面上转动一定角度，即在三维空间中作了转动，称为立体对［图2-12（b）］；第三种情况是两个不同的图形，它们是镜像对称的［图2-12（c）］。实验结果表明，无论是平面对还是立体对，如果两个图形的形状和方位都相同，被试者只需要1s就能看出两者是相同的；当其中一个图形转动一个角度形成方位差，反应时间增加，并且与方位差成正比。因此，Shepard等指出，“心理旋转”的速率是相对稳定的，每秒53°；同时表象不仅可以表征图形的二维特征，也可以表征物体的三维结构，证明了“心理旋转”的渐进性和空间性。

图2-12 表象的“心理旋转”实验

（据Shepard等，1978）

（2）表象的“心理扫描”实验：Kosslyn及其同事也在20世纪70年代初对表象进行了“心理扫描”的实验研究，认为视觉表象中的客体同样有大小、方位等的空间特性，是可以被“心理扫描”到的。他们要求被试者构成一个视觉表象并加以审视，以确定其中的客体及其空间特性，记录所需的时间。实验表明视觉表象是类似图画的，表象包含空间信息、表象的各部分描述所表征的客体的对应部分、所表象的客体各部分间的空间联系保留在表象的相应部分的空间联系中；评定其主观表象较小的客体要难于评定其主观表象较大的客体，小的客体总不如大的客体容易观察清楚。

（3）表象在人类认知中的重要作用：①表象与知觉的机能等价不仅会导致表象对知觉的干涉，而且会出现表象对知觉的促进；②图像信息在表象系统中储藏和加工，对于联想学习和记忆具有重要的作用；③人在解决某些问题时，主要依赖于视觉表象操作和表象过程，有助于科学家、艺术家、机械设计师等的创造性的思维活动，而听觉表象对于音乐家具有重要的意义。

4．视觉认知与信息技术

视觉认知心理学随着认知心理学的兴起而迅速发展起来，它以人的视觉信息处理过程为研究对象。广义信息理论和符号逻辑学是视觉认知心理学的两个理论基础。信息技术的发展为视觉认知心理学的发展提供了坚实的研究与应用手段。从概率统计论到泛函分析，从计算机分布系统到软件工程，从逻辑推理到专家系统，所有新兴的信息技术为视觉认知心理学的研究提供了技术手段。视觉心理学的研究着重以模拟人复杂的视觉行为为出发点，有机地将知觉、注意、记忆、学习、表象、思维、概念形成、问题求解、语言、情绪、个性差异等行为联系起来。视觉认知心理学主要研究内容为影像中拓扑性质、形状轮廓、三维物体和运动物体及其内在规律和行为过程的视觉化认知规律。

在传统的地图制作方法的低层视觉认知和以模拟左脑逻辑思维为主的视觉认知心理模型基础上，加强模拟眼睛视网膜成像系统和右脑大规模神经元并行地解决复杂而模糊视觉问题的生理机制，达到形象思维的能力，这样就形成比较完整的视觉认知思维和想象功能，在最大程度上使人的复杂而模糊的视觉行为和计算机技术的强大计算功能融合起来，使人的视觉认知达到快速、精确、知识无遗忘等境界。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈