8.2.2 编码标准
编码标准是确定信息发布和应用的技术标准,规定了信息的构成以及表示方式,在电子政务系统中为用户使用信息、应用信息提供了方便。从应用的角度出发,编码标准实际包含着三个方面的内容:一是信息的分类,为信息编码提供基础;二是信息编码原则,原则上确定分类信息的构成;三是编码方法,通过规范化的方法确定信息的构成。
1.信息分类
信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。
信息分类有两个要素:一是分类对象,二是分类的依据。分类对象由若干个被分类的实体组成。分类依据取决于分类对象的属性或特征,分类的科学性直接决定了信息编码的质量。因此,信息分类必须遵循以下基本原则:
(1)科学性
应该选择事物或概念(即分类对象)最稳定的本质属性或特征作为分类的基础和依据。
(2)系统性
将选定的事物、概念的属性或特征按一定排列顺序予以系统化,并形成一个科学合理的分类体系。
(3)可扩延性
通常要设置收容类目,以保证增加新的事物或概念时,不打乱已建立的分类体系,同时,还应为下级信息管理系统在本分类体系的基础上进行延拓细化创造条件。
(4)兼容性
应与相关标准(包括国际标准)协调一致。
(5)综合实用性
分类要从系统工程角度出发,把局部问题放在系统整体中处理,达到系统最优。即在满足系统总任务、总要求的前提下,尽量满足系统内各相关单位的实际需要。
2.信息编码
信息编码是将事物或概念(信息)赋予具有一定规律、易于计算机和人识别处理的符号所形成的代码元素集合。代码元素集合中的代码元素对应于具体信息,也是信息的符号表示,即编码对象的代码值。
电子政务中所有类型的信息都能够进行编码。通过信息编码,可以实现以下作用:一是标识,其目的是要把编码对象彼此区分开,在编码对象的集合范围内,编码对象的代码值是其唯一性标志;二是分类,信息编码的分类作用实质上是对类进行唯一标识;三是参照,信息编码的参照作用体现在编码对象的代码值可作为不同应用系统或应用领域之间发生关联的关键字。
依据信息编码的定义,信息编码应当遵循如下基本原则:
(1)唯一性
在一个分类编码标准中,每一个编码对象仅有一个代码,一个代码只唯一表示一个编码对象。
(2)合理性
代码结构应与分类体系相适应。
(3)可扩充性
代码应留有适当的后备容量,以便适应不断扩充的需要。
(4)简明性
代码结构应尽量简单,长度尽量短,以便节省机器存储空间和减少代码的差错率。
(5)适用性
代码应尽可能反映编码对象的特点,适用于不同的相关应用领域,支持系统集成。
(6)规范性
在一个信息分类编码标准中,代码的类型、代码的结构以及代码的编写格式应当统一。
3.信息编码的基本方法
编码方法应以预定的应用需求和编码对象的性质为基础,选择适当的代码结构。在决定代码结构的过程中,既要考虑各种代码的编码规则,又要考虑各种代码的优缺点,还要分析代码的一般性特征,选取合适的代码表现形式,研究代码设计所涉及的各种因素,避免潜在的不良后果。常见的信息编码方法有:
(1)无序码编码
无序码是将无序的自然数或字母赋予编码对象。此种代码无任何编写规律,是靠机器的随机程序编写的。无序码既可用作编码对象的自身标识,又可作为复合代码的组成部分(复合代码的其他部分则以其他编码规则为基础)。
(2)缩写码编码
这种代码的本质特性是依据统一的方法缩写编码对象的名称,由取自编码对象名称中的一个或多个字符赋值成编码表示。缩写码能有效用于那些相当稳定的,并且编码对象的名称在用户环境中已是人所共知的有限标识代码集,例如对国家名称等信息就可使用缩写码。
(3)组合码编码
组合码也是由一些代码段组成的复合代码,这些代码段提供了编码对象的不同特性。与并置码不同的是,这些特性相互依赖并且通常具有层次关联。组合码经常被用于标识目的,以覆盖宽泛的应用领域。例如我国居民身份证号码就是组合码编码方式:整个18位组合码共分4段,前两个代码段标识了编码对象(公民)的空间和时间特性,第三个代码段则依赖于前两个代码段所限定的范围,第四个代码段依赖于前三个代码段赋值后的校验计算结果。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。