首页 百科知识 古籍的数字化

古籍的数字化

时间:2022-05-05 百科知识 版权反馈
【摘要】:古籍数字化也使诸多难见天日的“镇馆之宝”得到新生,以难以想象的速度迅速传播。这种看法是片面的,对于以文字为主的中国古籍来说,它的数字化绝不是纸质版本的翻版和简单的文献载体的转换,而是一部融入学术研究成果的作品。古籍数字化的目的就是更大范围、更便捷、更有效地使这些文献为人们所利用,为学术研究提供服务。

古籍的数字化

第三节 古籍的数字化

随着信息传播手段的快速发展,传统的纸质文献受到了巨大的挑战,数字化文献已经显露出它在信息传播和利用上的极大优势。同样,作为我国传统文化最主要传播形式的古籍,其数字化也在不断地升温,越来越受到学术界和相关部门的重视。数字化古籍以其信息量大、检索快捷方便、不受时空限制等传统纸质出版物无法替代的优势,使古籍使用者的使用效率大大提高,使更多的学者“如虎添翼”。古籍数字化也使诸多难见天日的“镇馆之宝”得到新生,以难以想象的速度迅速传播。因此,许多古籍收藏单位都在积极地加工、处理自己的珍品,使之以数字化的形式供读者使用。古籍数字化是古籍整理的未来方向,是大势所趋,是时代向古籍整理工作提出的新要求。

一、对于古籍数字化工作的思考

1.全盘考虑,合理规划

古籍数字化是采用现代化技术,对古籍文献进行加工处理,制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献中所蕴涵的极其丰富的信息资源,为更好地开发和利用古籍奠定良好的基础。它是一项系统工程,应该充分考虑、合理规划。首先,项目开发者要根据”用户第一”的原则,充分进行市场调研,对自身开发能力和发展目标合理定位,选择适合自己的选题,以保证开发的项目与用户(尤其是专业研究者)的实际需求相吻合。选题的好坏直接关系到产品的质量,单纯依赖开发者自己的想象,或者依赖资源拥有者的主倡,或者依赖部分学者的建议,甚至依赖权威的一两句断言,都是不合适的。选题确定后,根据选题进行可开发内容的信息搜集,包括责任者信息、版本信息(版本类型、年代、版式、字体、刊刻地点、刻工姓名)、文献价值、现有各种相关专题资料等都是必须搜集的对象,它们对于开发出的产品质量起着决定性的作用。之后,对数字化目标进行采样、技术处理、测试、修改、完善,直到发布、用户使用情况反馈等。总之,我们在作古籍数字化时,必须全面借鉴现有的研究成果,借鉴已经问世的古籍数字化产品特别是一些大型的有影响的产品的成功经验(如北京大学的《中国基本古籍库》、《台湾汉文化联盟的汉文化资料库》等),力争使纸本文献珍品通过加工变成数字化文献精品。

2.以古籍专家为主导

古籍数字化项目确定后,由谁占主导地位来组织实施,是古籍数字化工作必须思考的问题,也是人们容易误解的问题。有人认为古籍数字化就是将古籍通过扫描或其他方式搬进电脑,再通过技术处理将其输出,供人们在计算机上阅读。这种看法是片面的,对于以文字为主的中国古籍来说,它的数字化绝不是纸质版本的翻版和简单的文献载体的转换,而是一部融入学术研究成果的作品。扫描是必要的,但扫描在很多情况下只是数字化的预处理。有实践表明,扫描只占数字化工程的2%,大量的工作还是其标引与发布。古籍数字化的目的就是更大范围、更便捷、更有效地使这些文献为人们所利用,为学术研究提供服务。它属于古籍整理和学术研究范畴,涉及版本、标点、校雠等一系列的学问,承担着“辨章学术、考镜源流”的学术任务。整理一部古籍,既要选择合适的底本,又要广校众本;既要精心标点,一一校勘,又要广徵群籍,拾遗补阙,界定其学术地位和学术价值。因此,古籍数字化必须以相关领域的学者,即内容专家为主导,决定数字化的内容、标引的深度、相关检索工具的配置等,并非任何人都能做。技术是形式,数字化内容是核心,内容决定形式,形式服务于内容。只有熟悉古籍内涵,懂得古籍整理,才有能力决定古籍数字化的基本思路和基本框架。

3.充分考虑数字化产品的研究支持功能

较之其他中文文献,古籍数字化是一切文献数字化的特例,其标引和规范控制更为复杂,对技术要求更高。随着计算机技术的发展,大量古籍数字化产品的实践,以前古籍数字化中面临的问题,如汉字字符集、OCR识别及全文检索等现在已经解决,如国内有代表性的大型古籍数字化产品《四库全书》、《四部丛刊》等做的比较好,已能基本满足用户的需求。现在的问题是如何对古籍数字化产品进行深入标引和严格规范控制,强化其检索功能,以解决古籍研究中遇到的各类问题,充分实现“知识发现”。古籍是为学术研究提供服务,数字化古籍是纸本古籍的更高级形式,它突破了文献的物理形态,深入到它所包含的信息单元,并将这些信息单元进行分合与重组,以向读者提供针对性更强、内容更丰富的服务。因此,我们在作古籍数字化时,应充分考虑其研究支持能力,如相关研究成果的链接、版本的自动校对、自动断句、自动标点、自动翻译、异体字的显示、生僻字读音的自动标注,以及字典词典、中西历对照表、人名大辞典、地名大辞典等各种知识库和辅助工具库的配备,以达到古籍内容的数字化与多种有效的检索、处理工具完美结合。这样,用户在使用我们的产品时,就能感受到我们奉献给他们的不仅仅是知识宝库,更是卓有成效的研究手段。有了这些研究支持功能,他们使用起来就会得心应手,就会多出成果、快出成果。

4.地方文献是古籍数字化的主要内容(以安徽省图书馆为例)

(1)体现特色

目前古籍数字化产品种类繁多,质量越来越好,但重复现象严重。就笔者所知,仅《四库全书》一种,有上海人民出版社与香港迪志文化发展公司联合开发的电子版,有武汉大学出版社的电子版,有湖南电子音像出版社的电子版等,这是人力、财力和物力的极大浪费。因为古籍数字化产品的对象毕竟有限,市场范围狭小,与其大家都争着搞一种,不如规避重复,突出特色,体现原创。这样的产品才会更有市场前景,更有生命力。

(2)丰富的地方特藏

安徽省图书馆典藏丰富,古籍特藏尤为全馆藏品精华所在,40万册古籍中安徽地方文献的收藏占有很大比重。特别是对于在中国传统文化中占有重要地位的新安理学、新安医学、徽商文化、桐城派以及地方志、家谱等的收藏基本形成体系,是解放前安徽地方文献收藏的最主要单位,古老而又深厚的安徽文化底蕴在这里得到充分体现。根据馆藏情况,可以构建出一个数字化“安徽文献”框架。这一构架浓缩了馆藏地方文献的精华,也在一定程度上代表了安徽深厚的文化底蕴。它充分体现了馆藏特色,是我馆的”镇馆之宝”,令诸多海内外学者不远千里,慕名而来。比如,随着徽学研究的日渐升温与日趋深入,大量徽州原始史料备受学者们的青睐。又如,随着国家文化政策的宽松,《中国家谱总目》的编纂,民间修谱热潮兴起,他们需要查阅大量家谱特别是本族谱的资料来为修谱服务。另外,家谱中蕴涵的大量人口学、社会学等史料也受专家学者们的偏爱。加之该馆家谱地域性强、质量高,近年来调阅量直线上升。

img14

图1 安徽文献框架

(3)具有一定的基础

数字化包括书目数据库和全文数据库,书目数据库是全文数据库的前提和基础。实际上,同其他省级公共馆一样,该馆的古籍数字化工作几年以前就已经开始。经过几年的积累,目前已拥有馆藏古籍书目数据库近10万条,包括馆藏善本、皖人书目、地方志、家谱等专题数据库,可以说馆藏古籍书目数据库已基本建成,经过筛选、加工和完善,就能根据需要把馆藏提炼出来。在此基础上,根据该馆实际情况,从读者需求量大、要求最迫切的文献开始入手,逐步延伸,就会形成独具特色的安徽省图书馆馆藏古籍数字化产品。

(4)具体操作

这一框架,既互相独立,又互相交叉、互相渗透,如“徽州文献”、“地方志”和“家谱”三个主题的资料就有相同的地方。具体操作中,可以选择以某一节点为主,向其它节点延伸。比如做“徽州文献”主题,除其本身的支节点之外,还向“地方志”和“家谱”等节点延伸,形成链接,再加上各种研究支持功能的配备,就能成为一个系统的“徽州文献”主题产品。这样,读者需要查阅徽州文献时,可以顺着“徽州文献”这一脉络,触类旁通,一直顺延下去。也可以从“家谱”主题入手,该主题中没有的话还可以链接到“徽州文献”,直到找到所需资料。按照这一框架去实现该馆古籍文献的数字化,既能使古籍数字化开发具有延续性和持续性,又能使我们提供的服务更有针对性,从而大大地推进广大研究安徽的学者们的研究速度,为更好地研究安徽、挖掘安徽、宣传安徽提供一个更好的平台。

(5)从文献保护的角度来看

多年的风化,频繁的调阅,使得一些古籍的破损程度越来越严重,虽然经过修补可以延长其使用寿命,但不能从根本上解决问题。特别是本馆所藏的这些安徽地方文献(如一些徽州家谱),调阅频率高,这方面的问题尤其明显,有时只得谢绝调阅。数字化过程中,可能对原文献有些伤害,但从长远来看,它还是对文献起保护作用的。文献数字化以后,一般就不提供原件,读者通过电子版来查看所需资料,可以避免因直接接触古籍而造成对其损坏。另外,再加强对纸质文献的保护力度。这样双管齐下,原文献的寿命就会大大地延长。

二、书目数据库

1.安徽省历代皖人书目数据库

可提供查询本馆收录的上起春秋、下至1949年新中国成立这几千年中安徽省人的著作9833 种的书目记录,主要以安徽省图书馆的收藏为主,兼顾安徽省博物馆、安徽大学图书馆、安庆市图书馆、桐城市图书馆等单位的收藏。本数据库以馆藏为主,集中整合了现存皖人著述,汇总了现存皖人著作,基本上反映了安徽文化学术发展的概貌,对于认识安徽、研究安徽,并从中汲取丰富的营养具有一定的借鉴作用。不仅为广大读者和专家学者提供查询,对安徽地方文化的建设与总结也具有积极的意义。检索点有题名、责任者、出版项。

2.安徽省善本书目数据库

可提供查询宋、元、明、清时期的刻本、稿本、抄本、批校本等共6216种古籍善书目记录。此数据库的最大特点是收录范围广,它涵盖了安徽省公共图书馆系统、安徽省大学图书馆系统和安徽省博物馆系统等。本数据库基本反映了安徽省古籍善本书的收藏情况,每条数据记录了古籍善本的外部特征、版本情况、内容信息等,具有较高的使用价值。检索点有题名、责任者、出版项。

3.普通古籍书目数据库

可提供查询馆藏三十余万册各类古籍的书目数据100574条。本数据库揭示了馆藏古籍书目全貌,为使更多的读者、专家研究和利用安徽省图书馆馆藏提供了方便。检索点有题名、责任者、出版项。

三、专题数据库(省图书馆)

1.《谱牒文献》

安徽省馆收藏明清至建国前家谱400余种,3200册。以徽州地区居多,部分收入《中国善本书目》,多为明代所刊,具有较高的价值。如《汪氏渊源录》,元泰定年间修,明正德十三年刻本,全国仅存两套,内载“黄山”“西湖”等大量艺文,版心存刻工姓名,十分珍贵;休宁《商山吴氏家谱》,为海内孤本,抄写字迹工整秀丽,“艺文”中所载大量诗文,是研究当地风土人情的重要史料;《休宁戴氏宗谱》,刻“隆阜村居之图”,规模宏大,刻印精美,堪称版画精品。馆藏家谱中亦包括如包拯家族《合肥包氏支谱》,李鸿章家族《合肥李氏宗谱》、龚氏所修《合肥龚氏宗谱》等名人名谱。“家谱数据库”是在“谱牒文献”专题的基础上,完善其检索功能,丰富了检索途径,收录了包括部分新修谱在内的共计900余条数据。

2.徽派朴学

该专题总容量为159 MB,现已经全部完成链接与调试,读者可在网上浏览检索。

3.安徽刻书

安徽刻书是安徽传统文化演进的一个重要阶段。安徽历代所刻之书深邃而广博,几乎涉及社会生活和文化生活的所有领域,既有供文人操觚射鹄的经史文集,又有供平民日常应用的类医卜算。不仅流派纷呈、成绩斐然,而且英才辈出,影响巨深。安徽省图书馆古籍书库珍藏的地方刻书文献,见证了安徽刻书的兴盛与发展,从一个侧面反映了安徽地区在印刷史、科技史、经济史、社会学史等诸多方面的流变与发展,为多学科专家学者的研究提供了翔实可信的史料依据。查找、扫描书影1201幅,编制相关款目,整理相关文档,共为212MB。

4.桐城文派

因其代表人物方苞、刘大櫆、姚鼐“三人皆籍桐城,世传以为桐城派”。它绵延二百余年,基本上纵贯整个清代文坛,是清朝最为流行,也是最大的一种散文派别,影响之大,波及范围之广为历来所罕见。方、刘、姚亦被尊称为“桐城三祖”,他们建立起来的文论体系使得古文运动不断发展壮大起来。该库搜集整理了902位桐城派名家资料,其中200人资料按规定格式录入CM数据库。读者可在网上检索。

5.安徽先贤传记

收集71位安徽先贤人物资料共81540字,书目700余条,并进行分类整理上网发布。

6.安徽地方志

收集整理数据446条,以CM方式制作在网上发布。该数据库分3级页面,11个字段,可以提供名称、年代、版本、关键词等检索点。读者可以在网上进行检索。

四、缩微复制

文献缩微是对古籍进行抢救性保护的有效手段。1994年安徽省图书馆借文化部评估之机,引进了缩微拍摄机,为我馆古籍和解放前报刊整理、开发和保护提供了物质条件。1995年,缩微设备正式投入运行,缩微工作人员刻苦学习,基本掌握了文献的整理,拍摄,冲洗和质检等各环节的工作,当年完成了1.5万余拍的任务,另外还完成了与北京《四库全书》缩委会签订的拍摄古籍善本5千多拍的任务。1996年完成资料整理66839拍,摄制50934拍,从1997至2001年每年整理、拍摄文献都超过了10万拍,2002年为64000余拍,省馆的缩微拍摄工作虽然起步晚,但取得的成绩却是十分突出的。缩微质量在全国始终名列前茅甚而名列全国第一,为此多次受到全国缩微中心的表彰。2002年省馆建立了缩微品数据库。截止2008年,缩微室共拍摄文献55万多拍,上交国家缩微中心胶卷840多卷。现已收藏各种胶卷:古籍590种1717卷;期刊320种302卷;报纸74种1163卷,民国书2302种,共3182卷。2008年,我们开始建立“安徽省地方地方文献缩微胶片库”,开始在各地查找有关安徽的地方文献资料,力求使我馆成为收藏安徽地方文献最为全面的单位。

目前,缩微工作室已建有缩微品书目数据3082条,其中古籍590条并提供文本目录,方便读者多种手段查询。另外,为数字图书馆的建设,缩微工作室现已对8种家谱、7种古籍、6种期刊、1种报纸(刘氏家谱、黄山集、学风等)共约1万张图片进行了影像扫描,并制成光盘,可提供读者直接使用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈