首页 理论教育 图书的计算机分类编目和录入

图书的计算机分类编目和录入

时间:2022-03-10 理论教育 版权反馈
【摘要】:学校图书馆计算机分编录入,特别是回溯建库,工作量大,如果不实行资源共享,即利用外来编目数据库,就目前大多数学校图书馆的人力和业务现状而言,那工程的时间和质量是很难保证的。所以现在一些地区的教育行政部门和图书馆人员开始认识到这一问题。另外,还以Z39.50协议解决了成员馆异构软件间的联合查询和联机编目。这种联合体是以订为主,统一采购编目。

第二节 图书的计算机分类编目和录入

不管是馆藏旧书,还是新购图书。在进行计算机录入前,首先要做好上述工作,有条件的一套丛书,多卷书及复本,其条码粘贴的顺序应是先复本,再上下册。如托尔斯泰的《安娜·卡列尼娜》上下册一套,本馆有5套,那么这套书先按条码顺序贴五个上册,然后再按条码顺序贴五个下册,因为计算机编目时,先著录上册,给分类种次号,最后给条码号。如果上、下册的条码是连号的,输完第一个条码后,只要连击五次回车键,那么这些条码会逐个自动加一,这样既提高了录入速度,又不会在录入阿拉伯数字时产生手误。

一、采用标准MARC进行编目和数据传送

现在学校图书馆选用的软件在数据的著录过程中,一定要采用标准的CNMARC(中文)和USMARC(西文)著录方式。看一个软件是否为真正的MARC,不仅仅是看其能否接受外来的标准MARC、更主要的是看其能否编一本著录项目较多特别是有主题词、外文原题名等字段的图书后,显示并输出的仍为标准的ISO2709格式。因为现在不少软件用的是伪MARC,对MARC数据能进不能出,或出来的MARC面目全非。

由于学校图书馆工作人员的业务状况,在数据的著录过程中,所用的软件应能提供卡片格式和MARC格式能互相切换和对照,能帮助图书馆编目人员实时查找著录数据过程中存在的错误。

二、通过Z39.50网络通讯协议进行联机查询和编目

当前在选择软件时,特别要强调有符合Z39.50通讯协议的联机查询和编目功能。这样不仅可以用同类软件联机编目,而且可用Z39.50的Client端去访问北图、丹诚、春晖等国内已实现Z39.50Server端功能的网站,抽调和下载编目数据,一个软件的Z39.50的Server端同样可供其他软件Z39.50的Client端抽调和下载编目数据。

三、多渠道来源的书目数据可大大加快计算机分编的速度

学校图书馆计算机分编录入,特别是回溯建库,工作量大,如果不实行资源共享,即利用外来编目数据库,就目前大多数学校图书馆的人力和业务现状而言,那工程的时间和质量是很难保证的。所以现在一些地区的教育行政部门和图书馆人员开始认识到这一问题。在回溯建库中,一是请专业化公司来完成;二是购买编目数据;三是与图书馆供应商谈判,要求其供书配编目数据。所以,对学校图书馆来说,回溯建库和新书编目的原始数据,绝大多数是可以通过各种方式获得的。

(一)国家图书馆建国五十年回溯编目数据库

图书馆界通常所说的“北图马克数据”,1995年,当时还称北京图书馆为国家图书馆,从组织力量,先编制了1978~1994年的书目数据,后来又编制了建国初至1968年的馆藏书目数据向社会上发行销售,不少公共馆和高校都曾买过这些数据,它不仅开创了我国书目数据资源共享之先河,更主要的它对文献编目的国家标准CNMARCR的普及和推广,起到了决定性的作用。但它早期书目数据的质量也不是很高。文字录入前后不尽统一。作为图书馆,其书目数据中的主题词MARC字段和子字段还不够规范。

(二)中国高等教育文献信息保障系统(CSLIS计划)联合编目数据

1998年,在教育部文教司和高校图工委的支持下,全国65所高校图书馆成立了这个组织。首先严格并细化了CNMARC在编目实践中的具体要求,并对联合编目成员馆的编目人员进行了严格的培训。另外,还以Z39.50协议解决了成员馆异构软件间的联合查询和联机编目。这个计划经七年的实践,技术日趋成熟,协调机制逐步完善,文献数据在品种质量和数据上发展都很快。不过当前这个计划并不惠及中小学图书馆。再说中小学图书馆文献的来源和收藏特点与高校有很大的差别。如高校的专业化文献,中小学的教参,青少年读物,双方都不可能交叉收藏。所以,中小学图书馆界和基础教育行政主管部门的,应参照CALIS,成立中国中小学文献信息保障系统,那样会大大促进我国中小学图书馆的资源共享和自动化、数字化的建设。

(三)中国版本图书馆图书在版编目(CIP)数据

1996年起,国家新闻出版署下属的中国版本图书馆,向全国500多家出版社发出通知,要求它们每出版一本书前,在向新闻出版署递交新书出版申请时,需递交填有这本书的中图法分类号和文献普通著录项目工作单。CIP再跟据这些内容,做成CNMARC编目数据。一方面,以卡片著录的形式,刊印在书的版权页上,供全国图书馆同行参照;另一方面,也向全国图书馆发行和出售MARC数据。CIP的编目数据,在《中图法》分类方面正确率从最初的40%到如今的80%,中小学馆可以基本参照。而它的著录格式和项目却不够规范。最主要的问题一是各种类型的题名著录不规范,二是各种规定的标识等随意使用或干脆不用;三是丛编名和丛编责任者著录不全或不著录。总之,在这方面起不到示范作用,有时连参照作用都难以发挥。主要原因还是两方面,一是出版社不重视,送交样本时著录项目不全或不准确,二是CIP中心组织的编目员业务素养不深,质量监管机制不完善。为此,CIP中心目前正考虑组织力量彻底重建其版本书目数据库,使之真正发挥版本数据源的样板作用。

(四)图书供应商的书目数据

这里所说的图书供应商有两种,一种是各公共或高校购书馆,由一馆牵头成立图书采编联合体。这种联合体是以订为主,统一采购编目。因为以某高校馆采编人员为班底,所以编目的规范性要好一些。如上海的申联、翔华,南京的高校图工委联合采编组,第二种是图书供应商为主,在看到售书带MARC编目会给他们带来更大商机时,就聘人进行MARC著录,由于是从商业角度出发,所以其编目数据的规范性要比前者差一些,但对广大购书用户来说,有了主要的著录项目,在进行图书编目时,就省事多了。

目前,江苏、上海、北京的少数中小学图书馆认识到这一点,购书时开始要求书商提供符合ISO2709规范的MARC书目数据,但不少图书馆同行,因本馆购买的软件在接收MARC数据上存在这样那样的问题而扫兴而归。

(五)回溯建库专业化公司积累的书目数据

目前,我国学校图书馆软件市场上,开始流行软件供应商为中小学馆进行回溯建库一条龙服务。由于绝大多数软件商对此项业务只重眼前利益,不注重编目员以往的长期培养,对编目数据不坚持严格的质检。例如,常州春晖信息技术服务有限公司已形成120万CNMARC书目数据和60万USMARC书目数据。其主要原因是该公司有一支接近标准的回溯建库的队伍。因此,编目速度快、质量高。六年来,为以清华大学、中国人民大学、中国社科院等为首的北京四十多家高校及国家研究机关图书馆和以上海图书馆、南京师范大学、浙江工业大学、广东中山大学图书馆为首的上海、江苏、浙江和广东地区的公共和高校图书馆,用CNMARC、USMARC进行古籍、民国文献和西文图书的回溯建库五百多万册。并为以清华附中,人大附中、上海西南模范中学、重庆一中、南京金陵中学为代表的全国近八百所中专、中小学图书馆回溯建库三千多万册。春晖公司的回溯建库之所以快,主要原因就是有120万的中文书目数据和60万的西文书目数据库以及1.2万种中外文期刊数据库。目前全国从事这项服务的还有南京的共创、河北的纵横、常州的华夏、大连的博菲特等公司。由于各软件供应商相继开展这一服务,大大推进了我国学校图书馆实现计算机自动化管理的进程。

四、全方位、多功能的各种编目辅助工具软件

书刊用计算机分编录入是中小学图书馆长期而细致的一项业务工作,也是图书馆人力资源投入较多的一项基础工作。所以,在从事这项具体工作时,除了要有前面所说的各种书目数据库外,如尽可能地利用各种辅助工具软件,那将更有助于提高分编录入的效率和质量,从而进一步提高文献的检索速度和系统的运行水平。这些辅助工具软件,有的可从专业软件开发商购买后挂接,有的则由本馆所用的图书馆自动化软件开发商自行设计而嵌在系统软件中的。目前我国图书馆计算机自动化管理分编录入时常用的辅助工具软件主要有以下几种。

(一)《中国分类主题词表》电子版

1994年6月,由当时的国家图书馆——北京图书馆为核心的40个单位,160名专家学者,历时八年编出的《中国分类主题词表》问世。《中国分类主题词表》分2卷6册。第1卷为“分类号—主题词对应表”(2册),第2卷为“主题词—分类号对应表”(4册)。“分类号—主题词对应表”部分以《中国图书馆图书分类法》(含《中国图书资料分类法》)为主,将《汉语主题词表》的全部主题词置于相应类目下,它相当于一部以主题词作注释的《中国图书馆图书分类法》或《中国图书资料分类法》和一个体系分类表型的《汉语主题词表》范畴索引,其质量优于一般的范畴索引。“主题词—分类号对应表”部分以《汉语主题词表》的字顺表为主体,增加了大量主题词串(主题词组配形式,也可称为主题词组配标题),并将《中国图书馆分类法》的全部分类号置于相应主题词或主题词串下,它相当于一部扩充了的《汉语主题词表》和一部主题词型的《中国图书馆分类法》类目相关索引。

《中国分类主题词表》是我国目前规模最大的分类法与主题法一体化的情报检索语言语种,共收录分类法类目5万余个,主题词及主题词串21万余条,包括哲学、社会科学和自然科学所有各个领域的学科和主题概念,适用于各种类型图书馆和情报机构对文献进行分类标引和主题标引,既可用于的手工检索系统,也可用于计算机检索系统。其印刷本出版不到一年,该表的电子版也向社会推出。

关于这部主题词表的概况,前面已作了简要概述。但在那里面谈的却不是主题词表的“正业”,而是另一层面的开发利用。当年,国家作为一个文化工程来实施的这一成果,其最初的是为了解决文献编目中标引主题难的问题。而这一问题恰恰又是我们中小学图书馆文献编目中因难度较大而长期无人问津的问题。

主题词即主题标引,又叫标题目录,它是按时照书刊内容的主题词顺序组织而成的目录。“主题词”是某一事物问题和学科项目规范化的标题,是表达书刊内容主题要领的词语总称。它可以将书刊内容所涉及的几个主题显示出来,让读者从主题词内容入手查检自己所需的书。如《朱可夫亲历记》一书的主题词是用I512.5和K835.12从中国分类主题词表电子版中抽调出①文学—报告文学—苏联;②人物传记—朱可夫—苏联。当读者想要找关于苏联朱可夫元帅的书,不懂分类、不知题名和作者,只有“苏联朱可夫传记”或者“苏联的报告文学”的概念,就可以从这二个概念的主题词入手,靠主题目录查到一系列有关朱可夫元帅的书目。其实,前面用主题词的主题概念查分类号一样,查出对应的分类号所属的相关书目。电子版软件为了方便不了解主题词词组结构的读者查检,对一个主题词串中的各个词组进行轮排组合,如报告文学—苏联;也可以苏联—报告文学去查。还可以只从报告文学去查。对于以中文MARC著录的,可以把主题词串拆成600个人名称主题“$a朱可夫$x传记”,还可拆成606普通主题“$a文学$x报告文学$y苏联”。可以说,主题目录是读者最易掌握,也是最方便的查检目录。但由于主题目录的编制对图书馆业务知识的要求较高,工作量也大,所以,当前我国大多数学校图书馆很少有编制这种目录的。但北京图书馆出版的《中国分类主题词表》电子版中的主题词,是1986年开始计划和组织编写的,当时全国各公共和高校图书馆文献著录还未普遍实行MARC格式,所以编出的主题词串是文学—报告文学—苏联,而如今MARC著录中606普通主题字段都就著成“$a文学$x报告文学$y苏联”的形式出现。又如“哲学理论—研究—日本—现代”,共四个词组。根据MARC子字段依据主题词串中每个词组的内容性质来定的原则,“哲学理论”是主标目,又叫论题主题,MARC子字段名为“$a”;“研究”是次标目,又叫主题复分,MARC子字段名为“$x”;“日本”就为地区复分,MARC子字段名为“$y”;“现代”为年代或时间复分,MARC子字段名为“$z”。所以整条MARC字段应著为:“606##$a哲学理论$x研究$y日本$z现代”,那么又如何把前者“—”去掉后,变成“$a”、“$x”呢?于是,常州春晖公司用半年的时间,通过程序判别和大量的手工干预、改造了这一22万多词条的数据库,把所有的“—”去掉,而在每一个词组前,根据它们的内容性质分别加上子字段名“$a”、“$x”“$y”、“$z”。这使得一些高校编目人员也十分惊讶。因此可以说,用这两个辅助工具软件,基本上解决了学校图书馆计算机编目中分类和建立主题词难的问题。

(二)《中图法》电子版

由《中图法》编委会提供数据、北京丹诚软件公司开发软件、北京图书馆出版社正式出版的我国第一部电子分类表——《中国图书分类法》(第四版)电子版于2001年月7月问世。《中图法》电子版的特殊功能已经在它有限的用户及有限的使用时间内显示了一定的利用优势。在计算机技术已经进入文献编目和文献检索领域而《中图法》电子版在图书馆尚未普遍使用的今天,及时了解和重视使用《中图法》电子版的检索功能和显示功能,无疑会给图书情报部门的文献整序和文献检索工作带来更高的效率和更优的质量。简单地说,就是把《中图法》(四版)分类详表中大约5万余条类目和类名,以用后者抽调前者的方法,来进行检索而自动分类。如“1239.8”类目,其类名为“评书”、类名注释“包括北方评书、扬州评话、陕北说书等。”,中小学图书馆作者在用计算机编目时如果有评书评话类的书,只要打开这个辅助软件,键入“评书”或“扬州评话”等词句中的任何一个词目,软件就会自动弹出“1239.8”的分类号。当然,如使用者键入“章回小说”一词,软件就会弹出“1242.4”,“1246.4”,“I247.4”等,凡含有“章回小说”一词的不同时代章回小说的分类号。

《中图法》电子版检索窗下的检索栏内为用户提供了15种检索途径。其中不仅有常见的“类号”、“类名”、“复分表”等检索途径,还提供了“类级”、“类级与类号”、“所属类目路径”、“评注文字”、“全部途径”等在印刷版中所没有的检索途径。这些分类法各要素的检索途径均能突破类表的线形体系,实现跨类检索。如“类级与类号”的检索,克服了印刷版分类法在类表中依次查询类目时,必须用缩进排版方式才能判断类目级别的弊端。为用户提供了快速判断类目级别和正确选择类目类号的检索途径。例:修订后的《中图法》四版中的“K81传记”类,采用了上下位类的借号法,用户在类分中国各科人物传记时,较难用类号的位数来判断书列在“K825”后面的“K825.1.K825.19、K826.1.K827、K828”等类目间的关系。如果采用“类级与类号”进行检索,只要在检索项中输入类级和类号“05K82”。就能快速解决从同一类号位数并不代表类目的级数而给用户带来辨类的困难。所以,电子分类法从学科角度进行任意等级类目的检索就更显示出了它的优越性。

但是,这个《中图法》电子版也有许多缺憾。如许多中小学馆常用到的仿分、复分就没有为用户扩展开来。如“I24小说”类的分类复分表就没有为用户复分好并嵌入软件中。当用户键入“革命斗争小说”和“革命斗争故事”时,就抽调不出“I247.51”和“I287.51”的分类号来。同样的情况在中小学图书馆常用的类目如“D73/77”,“K833/837”,“I3/7”等凡要仿分复分的类目中都普遍存在。这主要因为“中图法”电子版的数据来源于《中图法》印刷版的电子文档,而印刷板上的仿分、复分类目是需要用户自己去扩展和注释的,研发单位编制这个软件时不会组织人力去做这项工作,因此这就是《中图法》电子版用户使用频率不高,中小学馆几乎无人问津的主要原因。

(三)以《中图分类主题词表》为检索点的自动分类软件

目前,《中图法》四版类目近5万余条,类名词组近11万余条,而分类主题词表中的主题词及词串却有21万余条,如加上人工编入四版新类目和仿分复分的6000多条,就多达22万条。如果说《中图法》电子版可以用11万多条类名来查检5万多条分类号,那么,如果用《中国分类表主题词》中的22万条主题词串来查检仍是6万条的分类号,不是将检索词扩大了近一倍么?另外,仿分复分后加入的类目加进去后,用计算机程序编出检索软件不仅对广大图书馆、特别是给中小学图书馆的分编人员传来一个福音。因此,有的研发单位专门从事这项工作。譬如说“1247.59”是建国后中长篇小说的除政治、军事、史传等八类题材以外的“其他题材”小说,这“其他”指的是什么。《中图法》四版的分类表上没有,用《中图法》电子版也抽调不出。而《中国分类主题词表》中就可见到如下小说题材新名词:暴露小说;犯罪小说;感伤小说;纪实小说;流浪汉小说;说教小说;书信体小说;系列小说;心境小说;诗体小说;讽刺小说;才子佳人小说;小小说等共13种。制成软件后,使用者手上的书只要是这13种名词中的任何一个,一经键入该书名,计算机就立即会弹出“I247.59”来。

再看《中图法》四版“E297.3”这个类目,在中国人民解放军军史之下,其类名只有二行字:“抗日战争时期(1937—1945年)”注释为“(八路军、新世军、各地抗日人民武装的军事史入此)”,而《中国分类主题词表》这个类目下是:

E297.3抗日战争(1937—1945年)—中国人民解放军军史

抗日战争时期战役战斗;百团大战(1944年);陈庄战斗(1943年);车桥战斗(1944年);岱崮战斗(1943年);大龙华战斗(1939年);大悟山反扫荡(1942年);町店战斗(1983年);反八路围攻(1937年);反九路围攻;广阳伏击战(1937年);韩略村战斗(1943年);河南战役;淮北反扫荡(1942年);淮南反扫荡(1941年);黄桥战斗(1940年);黄土岭战斗(1939年);黄洋界保卫战;黄烟洞保卫战;晋南战役;梁山战斗(1939年);平型关战斗(1937年);齐会战斗(1939年);上下细腰涧战斗(1939年);神头村伏击战(1938年);苏中反清乡(1943~1944年);台儿庄会战(1938年);田家会战斗(1942年);徐州会战(1938年);午城战斗(1938年);武汉会战;汀桂战役;响堂铺伏击战(1938年);盐阜反扫荡(1943年);夜袭阳明堡(1937年);八路军;八路军一二九师;八路军一二0师;八路军一一五师;新四军;新四军二师;新四军六师;新四军七师;新四军三师;新四军四师;新四军五师;新四军一师。

不少图书馆同志看了这一大堆主题词串后都曾感慨万分,一是当年编写这一类目对应主题词的专家学者们,付出了多少艰辛的劳动;二是这么宝贵的财富几乎长期束之高阁;三是如果通过计算机编出检索软件,将会给我们图书馆人的分编工作带来多大的方便啊。因为使用者手中只要有任何一本关于抗日战争史的书(小说除外),不管是有名的“台儿庄会战”、“平型关战斗”、“黄桥战斗”;还是不大为人知的“夜袭阳明堡”、“盐阜反扫荡”,只要一录入上述主题词组,哪怕是少了后面一二个字,计算机马上会弹出“E297.3”这个分类号。此类情况,在这个自动分类软件中其是不胜枚举,这会对学校图书馆同行们的分类编目工作,带来多大的帮助啊!

当然,有了这种分类辅助软件,不等于学校图书馆人员不需了解分类法知识,因为只有弄懂弄通分类表的体系结构和分类的方法,用起这些工具来才能得心应手,游刃有余。

(四)ISBN号与出版社、出版地及出版地代码库

在文献编目中,ISBN号、出版社、出版地是非常重要的著录项目,如MARC格式还要加上出版地代码。所以绝大多数图书馆自动化软件都设计了存贮调用,回写上述数据的辅助工具库及实用软件。首先,设计者把全国出版社的信息资料建成基本库,如有新建的,只要一次录入,程序就会回写存贮、供以后反复使用。编目时,只要一键入ISBN号,该出版社名、出版地、出版地代码就会跃入显示屏。对于1988年前,我国尚未普及ISBN号以前出版的书,有的软件还设计出输入出版社名,前三字拼音首字母的方法调出出版社名。如录入员知道“百花洲出版社”社名,只要输入“BHZ”三个字母,电脑就会显示出出版社名、出版地、ISBN号,这样不仅方便录入,而且也不会写错出版地和出版社名。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈