7.1.2 学术数字信息资源公共存取战略中的SWOT分析模型
1.优势
(1)我国信息化战略为数字信息资源的发展创造了契机
我国信息化建设始于20世纪80年代,一直得到我国政府的高度重视。邓小平同志早在20年前就指出:“开发信息资源,服务四化建设。”江泽民同志多次强调:“四个现代化,哪一化也离不开信息化。”胡锦涛同志在许多重要讲话中都要求,要大力推进国民经济和社会信息化。党的十五届五中全会决定,“把推进国民经济和社会信息化放在优先位置”,作为“覆盖现代化建设全局的战略举措”。党的十六大把大力推进信息化作为我国在新世纪头20年经济建设和改革的一项主要任务,要求“坚持以信息化带动工业化,以工业化促进信息化”。在党中央、国务院的带领下,经过各地区、各部门和各个方面的共同努力,我国信息化建设取得了重要进展,信息资源开发利用也借着信息化的春风取得了令人瞩目的成绩。
2006年3月,国务院信息化工作办公室发布了《中国信息化发展报告2006》,显示了在政务信息资源、公益信息资源以及市场信息资源等方面取得了较大的突破。其中,有不少成果都与科学研究紧密相关,可以用一组数据来说明。
第一,重大基础信息库的建设与应用取得了新进展。例如,2006年2月,国家基础地理信息系统1∶5万数据库建设工程通过验收,1∶25万海洋基础地理数据库进一步完善,国土资源综合统计基础数据库建成,民政部从2005年初全面启动“中国自然灾害灾情数据库”的建设。
第二,搭建国家科技基础条件平台。2005年7月,科技部、国家发改委、财政部、教育部联合发布《“十一五”国家科技基础条件平台建设实施意见》,提出到2010年,搭建由研究实验基地和大型科学仪器设备共享平台、自然科技资源共享平台、科学数据共享平台、科技文献共享平台、成果转化公共服务平台和网络科技环境平台等六大平台为主体框架的国家科技基础条件平台,为各类科技创新活动提供良好环境,使全社会都能享受到科技进步的成果。
第三,专利信息资源开发利用取得进展。2005年,在专利信息数据加工领域,为建设具有自主知识产权的《中国中药专利数据检索系统》(CTCMPD)中、英文版,进行了中药数据库标引和翻译;在专利信息系统建设方面,开发了“数据资源存储系统”和“生物序列数据库”,并对“中西药检索系统”进行了整合。在积极推进专利数据库开发的同时,2005年11月,国家知识产权局联合新闻媒体构建了中国专利信息发布台,免费为专利发明人传播专利转让信息并提供维权咨询服务。
第四,国家数字图书馆资源建设工作取得新进展。截至2005年底,国家图书馆数字资源累计总量已逾120TB,其中:全文影像数据10 400万页,音频数字化转换40多万首,视频数字化转换1.5万部;外购中文数据库30个,外文数据库102个,DIALOG国际联机数据库600多个,中文电子出版物2万余件,外文电子出版物1 000余件,音像制品10万余件,网络资源采集总量1 195GB,新增西文善本数据33万余种7 000万页。
与此同时,互联网在我国也呈现出良好的发展态势。2005年底,cn域名已经成为亚洲最大的国家顶级域名,在全球所有国家顶级域名中的排名从年初的第13位上升到第6位。
我国数字信息资源建设在国家高瞻远瞩、审时度势的部署下,已经具有一定的规模。与国外相比,我国政府更多地从政府信息公开、为公众服务的目的建设国家基础数据库和重点业务应用系统,从而使得绝大多数数字信息资源掌握在政府部门或公益机构,为实施数字信息资源的公共存取战略创造了条件。
(2)社会主义价值观和和谐社会目标为数字信息资源公共存取提供了思想武器
我国是社会主义国家,社会主义价值观决定了在信息服务领域,国家倡导的是公共服务的理念,这种理念对于推行数字信息资源的公共存取提供了有利的指导思想。
纵观我国社会主义主导价值观的发展,从社会主义集体主义价值观、为人民服务价值观、“三个代表”价值观到以人为本价值观都具有深刻的内涵,这些社会主导价值观随着时代的发展其内涵将进一步丰富和发展。在新的时期,“八荣八耻”社会主义荣辱观则是对社会主义社会价值观的新概括和新阐释。这些价值观与构建社会主义和谐社会的本质要求和价值追求是一致的,是我国构建社会主义和谐社会建设实践的重要指导方针。
和谐社会的实现离不开公共服务的发展。在中共十六届六中全会上,审议通过了《中共中央关于构建社会主义和谐社会若干重大问题的决定》,明确提出了“社会更加和谐”的奋斗目标。其中包括“基本公共服务体系更加完备,政府管理和服务水平有较大提高”。这表明,公共服务和公共管理的和谐,不仅是和谐社会的重要组成部分,也是构建和谐社会的必然要求。政府公共服务水平的高低和公共治理的和谐,直接影响整个和谐社会的建设。
尽管和谐社会理论中强调的是政府公共服务,但是这种思想已经渗透到科研信息领域。我国科学研究的特点是政府主导比重大,重大的研究课题和经费资助都是由政府部门规划的,因此,政府管理方式的改变对科研的影响不容忽视。在过去,国家的财力重点是在经济建设方面,对科研的扶持力度一直不够。随着和谐社会目标的提出,我国逐渐加大公用基础设施、公共文化设施、公共卫生设施、公共教育设施等方面的建设。国家对公共服务的重视和完善必然会推动科研领域公共服务的发展。
(3)我国绝大多数网络信息资源提供免费存取
用户获取信息的主要方式是上互联网浏览各种类型的网站。一般说来,政府网站、公益性网站、个人网站都免费提供信息浏览服务,只有少数的商业网站提供付费信息服务。《2005年中国互联网络信息资源数量报告》结果表明,商业网站提供的信息服务中,新闻、教育、军事、休闲娱乐、医疗保健、文学艺术、旅游交通等类信息是100%免费服务,而产品、商贸、企业、科技、金融财经等类信息要付费存取,但是付费的比重并不高。以科技信息为例,需要付费的占6.9%,免费的高达93.1%。
用户往往不满足从互联网上获取的各种半结构化、非结构化的网页信息,对科研人员而言,各种收录高质量学术信息的在线数据库是从事科研最主要的信息来源。2005年互联网网络信息资源数量调查中专门调查了各类在线数据库的收费情况,结果表明:虽然几乎所有的在线数据库都采取了收费机制,但是收费所占的比重并不大,最高的是人物在线数据库收费比例也只有10.3%。与学术信息相关的在线数据库包括科技信息数据库和期刊论文数据库,其免费提供的比例分别达到90.2%和93.3%。
这份报告说明了我国信息内容提供商还是以免费提供网络信息资源的做法为主,相比美国、日本等高度商业化的信息市场,信息的商品化程度较低,完全以获取利润为目的的信息市场在我国尚未形成。这种信息市场格局为学术数字信息资源公共存取的实现减少了障碍,有利于数字出版商向免费提供学术出版物方式转变。
(4)开放存取运动在我国得到积极响应
开放存取运动兴起后就得到了我国科学界的认同。2004年5月,中国科学院和中国国家自然科学基金会签署了《柏林宣言》,表明中国科学界和科研资助机构支持开放获取的原则立场。随后,有关开放存取的论文数量每年呈倍数增长,“科学信息开放获取战略与政策国际研讨会”等一系列会议的召开,奇迹文库、中国科技论文在线系统等一系列项目建成运行反映出人们对开放存取这一新鲜事物的极大关注和支持。分析我国学者对开放存取认同的原因,在笔者看来可能有以下几个因素。
首先,开放存取倡导的读者免费获取科研信息的理念符合我国绝大多数科研人员的愿望和现实需要。科研人员也是科研信息的最大需求者,但是由于各方面原因,科研人员的信息需求往往也得不到很好的保障。其中,主要是因为许多科研机构的经费有限,不能提供足够的资金来购买科研人员需要的所有科研刊物。开放存取运动兴起后,其宣称的读者免费获取科研信息的观点代表了广大科研人员的心声,因此,以极大的热情投入其中自然成了众多科研人员的直接行动。
其次,我国的学术期刊出版机制比较能适应向开放存取转变。开放存取运动兴起原因之一是在传统出版模式下学术刊物价格飞涨,阻碍了学术的交流。我国的学术期刊大多附属于政府机关、科研机构和大学等非盈利性机构,主要靠国家补贴和作者版面费来维持运营,基本上还没有完全走上商业化道路。特别是收取版面费是我国学术期刊的惯常做法,科研人员早就习以为常了。因此,在开放存取中提出的作者付费出版模式只要没有超过作者的承受能力并没有遭到科研人员的强烈反对就可。
最后,开放存取能激发科研人员的创作动力。许多研究人员发表论文并不是为了获得经济利益,而是希望在尽可能大的范围内传播其研究成果,取得同行的认可,提高自己的学术地位。开放存取能让更多的人分享研究人员的成果,有利于研究人员提高知名度,从而产生继续创作的激情。
总之,我国学者基本上对开放存取抱积极乐观的态度,认识到开放存取将掀起一场新的学术信息交流模式,将会给长期以来困扰学术界的科研信息获取困难问题带来新的解决方案。
(5)我国已经开展创作共用协议的本地化工作
“创作共用协议”是开放存取运动中倡导的知识产权保护机制,也是解决信息公共存取知识产权问题的一个有效措施。但是这个根据美国法律体系写的协议在其他国家应用时可能无法符合各国的实际情况,开展本地化的创作共用协议研究是各国面临的工作。我国在这方面已经取得较大的进展,成为率先发布本土版创作共用协议的29个国家之一。
我国的这项工作是由中国人民大学及CNblog.org负责的,目前最新版本是2006 年3月份正式发布的知识共享中国大陆版许可协议2.5版。在该版中,结合我国实际情况,将标准版中的4种授权协议组合出6种常见的作品授权。这些组合方式构成了从“松”到“紧”的授权限制,给作品的创造者更加灵活便利的选择。
(6)发展中国家的身份可获得一些特殊的照顾
发展中国家的身份还给我们带来一个优势,那就是致力于开放存取运动的国际组织对发展中国家的一些特殊照顾。如健康信息网络存取计划(HINARI)从2002年1月起,对人均国民生产总值低于1 000美元的国家提供免费在线订阅。开放社会机构(Open Society Institute)宣布了一项新的赞助计划,对来自发展中国家的科研人员可以向其申请资金用于在PLoS期刊上发表论文。其他还有一些资助机构如Howard Hughes医学研究所、惠康基金会(Wellcome Trust)、马普学会(Max Planck Institute)和法国科研中心(Centre National de La Recherche Scientifique)等都专拨经费用于在开放存取期刊上出版论文。其他乐意支付出版费的一些基金组织可以从www.biomedcentral.com/info/about/apcfaq#grants上获知。
这些资助活动缓解了科研人员支付出版费用的压力,我国学者可以抓住这一机遇,多渠道获得资助,保证不受经济问题的影响而将文章发表在开放存取期刊上。
2.劣势
(1)数字信息资源的供给能力和需求存在很大的缺口
我国信息化发展总体水平与世界发达国家相比仍然存在较大差距,信息技术自主创新能力不足,信息技术应用水平落后于实际需求,信息安全问题仍比较突出,信息化法制建设需要进一步加快。所有这些差距都会给数字信息资源的发展带来不利影响,如中文学术数据库的数量仍远小于国外学术数据库,远不能适应网上日益增多的中文信息组织的需要;在国际上有影响的期刊数量不多,被国际上著名的期刊检索工具(SCI、SSCI、AHCI、EI等)收录的我国期刊数目较少。中文出版商很少加入国际出版组织,英文出版物数量远远超过中文出版物。
而随着互联网在我国的迅速发展,对网络信息资源等数字信息的需求不断膨胀。中国互联网络信息中心的统计显示,到2005年底,我国网民总人数为1.11亿人,居世界第二位。上网计算机4 950万台。通过接入互联网上的计算机来获取信息资源成为人们最主要的信息利用手段,庞大的基数也预示着人们的信息需求量是巨大的。相比这么大的信息需求量,数字信息资源建设中存在的问题会直接导致国民对目前网络信息资源建设现状的不满,在未来加大开发利用数字信息资源的力度仍是发展目标之一。
(2)开放存取的理论研究和实践探索仍处在初级阶段
相比美、英等发达国家的研究,我国开放存取进展明显落后。
从理论研究来看,2004年以后才开始对开放存取的探讨。随后2年来,绝大多数学者还停留在对开放存取的介绍和国内外概况研究的初级阶段,缺少深度。直到2006年底,才有学者开始研究开放存取的质量评价、经济机制、版权、机构资源库建设等能推动开放存取发展的重要问题。整体上,我国学者对开放存取的研究仍停留在较浅的理论层面,研究的范围还没有突破《柏林宣言》、《布达佩斯开放存取先导计划》等国际上发布的文件中的概念框架,缺乏实质性成果。
从实践来看,开放期刊和机构资源库建设仍在探索阶段。开放存取期刊的数量有限,且以理工科领域的居多,人文社会科学领域的开放存取期刊极为少见。机构资源库虽然有较大的发展,但是存在规模小、功能简单、缺乏影响力、质量控制机制随意等问题,难以形成大的气候。
从长远来看,需要借助开放存取的力量,抓住我国开放存取运动的机遇,来实现我国数字信息资源公共存取战略。而我国目前对开放存取的理论研究和实践探索还处在初级阶段,势必影响到对数字信息公共存取道路的探索,当务之急,是加大对开放存取的研究。
(3)数字信息资源的标准建设面临挑战
首先,从标准的建设模式来看,具有典型的“政府主导”特色。这种区别于西方国家浓厚的商业气息的标准制定模式虽能为我国标准建设带来益处,例如能从数字信息资源的长远目标和公众利益出发制定标准,能为标准的推行提供政策保障。但是,也存在诸多弊端,企业参与不了标准的制定过程,一方面会使得标准的适用性受到影响,另一方面会导致我国企业在信息产业中失去了主导地位。因此,要积极探讨适合我国国情的标准建设模式。
其次,从标准建设看尚有许多问题没有解决。我国在数字资源建设的同时却忽略了标准的研究应用。一是缺乏明确的统一标准建设原则、方向和规范程序,难以统筹规划各个相关标准,导致研究成果分散、孤立。二是没有从数字资源建设与服务的生命周期来全面认识标准的内容和层次,缺乏对标准开放性和互操作性的深入认识,缺乏对标识符体系、资源集合描述、知识组织体系描述和管理机制描述等方面的研究。三是在国际标准市场上缺少有力的席位。我国总是在国际标准制定完之后很长时间才开始制定国内相关标准,在国际标准处于讨论过程时,我们不能跟踪和参与国际标准的制定,总是在别人标准制定完毕并开始应用的情况下,才匆忙去引进。导致关键标准都被国外拥有,我国缺乏普遍接受和广泛应用的关键标准[3]。
第三,从标准的应用来看,效果不甚显著。各单位在标准的应用方面存在很大的随意性。以元数据标准的应用为例,不同部门采用的元数据标准多种多样,有采用DC元数据集的,有采用MARC的,还有采用SGML的。即使采用DC,各单位在具体应用方案上又不尽相同:有用DC的12个核心元素和限定词的,也有用14个、15个、16个等等,对各元素的理解也不相同。这种大标准下的“小标准”现象使得标准的真正价值没有体现出来。
第四,从标准的管理机制来看,缺少协作协调机制。我国由于没有强有力的机构进行统筹规划,造成各自为政的局面。像国家图书馆利用其地位优势和技术优势,以图书馆联盟的形式向区域性、行业性和大学图书馆渗透;北京书生科技公司在行业中倡导中国数字图书馆标准化工程;国家质量监督检验检疫总局委托中国数字图书馆战略组制定相关技术标准等。标准层出不穷,缺乏协调机制,使得标准的应用力度和范围受到限制。
(4)创作共用协议在我国的研究和应用有待推进
尽管我国已经正式颁布了知识共享中国大陆版许可协议2.5版,但是在理论研究和实际应用方面却进展缓慢。
从发表的论文情况来看,在《中文科技期刊数据库》和《中国期刊网专题全文数据库》中输入“创作共用协议”、“知识共享协议”等检索词,截至2006年底共收录论文26篇。整体情况不容乐观,反映我国在这一领域的研究基本上处于空白。
从社会关注情况来看,很多人还是第一次听说过国际上发布了这样一项协议,对我国已经颁布了本土化版本更是前所未闻。我国对创作共用协议的研究基本上还处在闭门造车的阶段,缺少向社会宣传。
从应用情况来看,除了少数前卫blog采纳这种协议外,应用“创作共用协议”的中文数字作品并不多见。许多数字信息出版机构仍把它看做是一个新鲜的事物,谨慎地使用。2006年最高人民法院公布了涉及计算机网络著作权纠纷案件的司法解释,规定在网络进行转载、摘编并按有关规定支付报酬、注明出处,不构成侵权。这个规定带有“创作共用协议”的影子,但仍然没有直接采用创作共用协议。
未来我国更需要积极融入国际创作共用协议的研究队伍中,加大推行创作共用协议在我国的研究和应用力度,充分发挥这一协议在解决信息公共存取中知识产权保护问题方面的作用。
(5)数字对象标识符技术尚没有被普遍接受
相比国外大型全文数据库出版商大多采用DOI(Digital Object Identifier,数字对象标识)技术作为其数字内容和实体的唯一标识符方案,我国的中文数据库还普遍处于自定义唯一标识符阶段。中文科技期刊数据库采用自定义内部链接号方式,方正电子图书库采用的是ISSN号和中图分类号的方式。这些自定义唯一标识符带有很大的随意性,而且在解决知识产权、跨系统互操作以及永久唯一性方面并没有发挥有效作用。相反,DOI以其高度的灵活性和适用性能解决当前互联网上信息的知识产权、跨系统的互操作、永久唯一标识等问题,成为最具前景的技术热点之一。
我国是学术数字信息资源的生产大国,为了与世界先进水平接轨,我国应积极地与有关组织机构(如大学图书馆,文献情报机构等)合作,借鉴美国、日本等国的先进经验,积极地推进具有中国特色的DOI系统的研究与开发,推进适合中国国情的DOI实施模式和管理机制。提高在网络分布式环境下信息资源存取的有效性,最终达到资源共享的目的。
(6)社会资助来源少,实现数字信息公共存取的资金短缺
在国外开放存取运动中,开放存取期刊数量之所以每年能够快速增加,其主要原因之一是国外有许多基金、社会组织、私人企业资助开放存取的发展。这些资助能够弥补开放存取期刊运营过程中产生的成本,保障开放存取项目的顺利开展。但是,在我国,期刊的发展大都靠的是政府和科研机构的扶持,国家不可能提供太多的资助,无法为开放存取发展所需要的资金提供充裕的保障。以我国第一个开放存取机构资源库奇迹文库为例,它是由一群中国年轻的科学、教育与技术工作者创办的非赢利服务网站,所有的资金都来自志愿者的主动捐献。
再者,开放存取倡导作者付费出版,这在发达国家并没有很大障碍,因为科研人员所在的科研机构资金雄厚,往往能够为科研人员的作品出版提供支持。但在我国,这是阻碍开放存取发展的一个因素,因为我国是发展中国家,经济条件比较差,科研机构与科研人员在资金上比较拮据。如果作者承受不起出版作品的费用,就会反对这种新的学术交流模式。
所以,为了实现学术数字信息资源的公共存取战略,未来一方面要建立重点开放存取项目和品牌期刊,有效地配置国家资助的财力;另一方面,要争取更多的社会力量。
3.机会
(1)国际上对学术信息公共存取的呼声高涨
人类的基本权利在信息领域的具体体现就是自由、平等、公开地利用信息。国际上许多国家在政策法律中将公共获取信息作为正式条文列入,在科学研究领域,许多国家也制定了相应的政策,倡导学术信息的公开存取。
例如,美国1998年兴起的“自由扩散科学成果运动”、2003年通过的《公共存取科学文献法案》以及2005年由美国国立卫生研究院制定并生效的“促进公众存取研究信息”的政策都反映了人们开始认识到科学信息公共存取的重要意义,要求改变过去保守、限制传播的做法,让更多的人受到学术信息公开带来的裨益。
在国际上,经济合作发展组织OECD 1991年发表部级公报“要促进环境数据和信息的完全与公开交换”。1994年,国际社会科学学会全体会议通过社会科学数据管理政策,其基本目标之一是实现所有数据库,对所有社会科学家,实行完全与公开的共享。
由此可见,国际上已经形成了要求学术信息公共存取的氛围,并首先从政策角度保障其在实践中能够顺利实施。在这种背景下,我国开展学术信息公共存取既是顺应国际科学界的要求和趋势,又能从国外的实践中汲取成功经验,促进我国学术信息资源被更多的公民公开获取。
(2)国际上兴起了开放存取运动,在理论和实践方面取得进展
开放存取是在学术出版领域兴起的一场新的信息交流活动,按照《布达佩斯开放存取先导计划》的定义“对于某文献,存在多种不同级别和种类的、范围更广、更容易操作的获取方法。对某文献的‘开放存取’即意味着它在Internet公共领域里可以被免费或以少量费用获取,并允许任何用户阅读、下载、复制、传递、打印、搜索、超链该文献,也允许用户为之建立索引,用作软件的输入数据或其他任何合法用途。用户在使用该文献时不受财力、法律或技术的限制,而只需在获取时保持文献的完整性,对其复制和传递的唯一限制,或者说版权的唯一作用应是使作者有权控制其作品的完整性,及作品被正确接受和引用”。从中可以看出,开放存取与公共存取没有本质的区别,学术界在开放存取运动理论和实践的进展可以为我国学术数字信息的公共存取提供借鉴。
开放存取运动主要取得了以下进展:
①召开了一系列的重要国际会议,提出和确立了对开放存取运动影响深远的倡议、宣言、原则和策略。其中最重要的文件是《布达佩斯开放存取先导计划》、《Bethesda开放存取出版声明》和《柏林宣言》,这三份重要的文件如同三座耀眼的灯塔,指导着后人对开放存取的研究,推动了开放存取运动的发展。特别是在《布达佩斯开放存取先导计划》中提出了实施开放存取的两种方式:自我存档(Self-Archiving)和开放存取期刊(Open-access Journals),为开放存取实践提供了两条可行通道。
②吸收许多国家科研机构参与到开放存取中,得到了多方力量的支持。例如,美国国会图书馆、CoMell大学、Mellon基金会等都表示关注开放存取。尤其是2003年首批签署《柏林宣言》的科研机构达到了30余个,越来越多的科研机构呼吁向所有网络使用者免费公开更多的科学资源。
③自我存档资源库在实践中发展。Eprints.org网站(http://www.eprints.org)提供了一份当前开放存取资源库的清单和一本如何自动构建开放存取资源库的操作手册;SHERPA项目(http://www.sherpa.ac.uk)正在许多研究型高校开展开放存取机构资源库的建设;最著名的开放存取搜索引擎OAIster(http://www.oaister.org)能从分布在不同位置的机构资源库中检索出用户所需内容。
④开放存取期刊从数量到质量都获得极大提高。瑞典Lund大学图书馆2006年底收录的高质量开放存取期刊数目已达到2 477种,且在不断增加中。开放存取论文的引用情况是衡量开放存取期刊影响力的主要指标,研究表明,开放存取期刊的质量在逐步提高,在学术界的影响力也越来越大。以期刊“Journal of Postgraduate Medicine”为例,2000年向该期刊的投稿数量不到200篇,到了2004年这个数字已经超过了600篇,在ISI的影响因子也逐年提高,2000年的影响因子低于0.05,到了2003年则接近0.3[4]。
(3)创作共用协议来解决知识产权与公共存取的矛盾
创作共用协议是在开放存取中倡导的知识产权保护机制,其内容是除特殊说明外,任何人都可以免费拷贝、分发(任何形式)、讲授、表演某个站点的任何作品(文字、图片、声音、视频等)。创作共用协议对数字信息资源公共存取的贡献在于:
①一旦数字作品选择了应用“创作共用协议”,即意味着任何人在遵循一定条件下,都可以免费拷贝,以任何形式分发、讲授、表演任何数字作品甚至其派生作品。这与公共存取的要求不谋而合。
②用户使用“创作共用协议”作品的条件是必须满足作品中的授权方式要求,“创作共用协议”共提供了4个最常见的授权方式,供作者自由、灵活选择。
③有一套较为简单的使用规则,方便数字作品在互联网上传播,从而使得选择“创作共用协议”的数字作品能被用户通过常见的搜索引擎发掘。
创作共用协议产生的目的就是让任何创造性作品都有机会被更多人分享和再创造,共同促进人类知识作品在其生命周期内产生最大价值。这种思想得到了众多机构、组织、个人的积极响应,许多学者将其新创作的著作选择采用创作共用协议,一些开放存取期刊出版机构也直接采纳此协议,更不用说相当多数量的大型网站和个人博客网站中使用了创作共用协议。特别是在科研信息领域,针对科学信息的获取,创作共用组织又继续制定了“创作共用协议”的演化版“科学共用协议”,从而使得科学信息的知识产权保护有了解决思路。总之,创作共用协议可以说在解决知识产权带来的信息资源垄断问题上迈出了可喜的一步,为数字环境下信息资源的公共存取创造了条件。
(4)实现开放存取的开源软件普及
信息公共存取的技术研究也取得了较大的进展,标志性成果之一是提出了基于OAI-PMH的数字信息开放存取体系框架。该体系框架的提出为网络上元数据的互操作问题提供了一种可行的解决方案,使用户的访问不受系统平台、应用程序、学科领域、国界及语言的限制。
基于OAI-PMH的数字信息开放存取体系框架提出来后,在世界许多国家得到广泛应用。像英国南开普敦大学开发的Eprints、美国麻省理工大学图书馆与惠普公司开发的Dspace、欧洲核研究理事会开发的CDSware以及康奈尔大学等开发的Fedora等都是基于OAI-PMH的开放存取系统。他们都公布源代码,是真正的开放软件,用户可以自由移植、重新配置,或者二次开发。
此外,一些已经问世的开源软件(Open source software,简称OSS)也为开放存取提供了技术支持,如Red Hat Linux OS、Javascript、Apache Web Server等等。许多机构在建立机构资源库时可灵活选用需要的技术。
(5)DOI技术为信息存取的有效性提供保障
在数字信息资源存取中,需要一个唯一而完整的标识系统来保证信息存取的准确有效性。数字对象标识符(DOI)技术的出现和发展正好满足了这一需求,它是互联网上重要的基础设施和名称管理机制,适用于通过网络服务发现和识别数字内容,已被国际标准化组织吸纳成为国际标准ISOTC46/SC9。DOI技术不仅能唯一标识出数字对象,而且能吸收各个领域已普遍使用的现有标识格式,具有很好的兼容性优点。
DOI技术提出来后,得到了国外许多机构的积极响应,特别是电子数据库提供商,包括Elservier,Springer Link,Blackwell,John Willey等多家出版商,正在逐渐采用DOI来标识自己的内容实体。DOI的应用范围也逐步从现有的出版领域扩展到电子政务、电子商务中,如英国政府部门、经济合作发展组织OECD等组织的文献管理都采用了DOI技术,呈现出很好的发展态势。据统计,目前已经有1 000个命名授权机构,超过1 500万个DOI注册[5]。目前在互联网上最成功的应用是CrossRef数据库。
CrossRef是多个出版机构联合建立的开放式参考文献链接系统,每个成员出版商从International DOI Foundation获得了一个DOI作为前缀,出版商为其出版的每一篇期刊论文编制一个内部号作为后缀,形成一个唯一的DOI标识表示数字对象。CrossRef的功能犹如一种数据转换盘,它虽然不存储全文,但能够使出版商和其他组织通过利用DOI对成员的出版商出版的论文加以标识,创建链接。用户点击CrossRef链接,就可以链接到显示有论文全部引文目录的出版商网页,大多数情况下,也包括引文的文摘。DOI技术保证了CrossRef中数据在网上的固定性,一旦文章的网址发生改变,只要出版商在CrossRef元数据库中DOI目录中更改文献的URL即可。一旦出版商改变它的URL,只要在中心DOI目录中更新,每一个与之相关的DOI便会自动更改,对网站读者而言,这一切都是透明操作的,没有任何影响[6]。
DOI技术为学术数字信息资源的有效存取带来了革命性的影响,CrossRef也在不断地提高其性能,扩大其影响,截至2006年底,已有500多家出版机构申请加入CrossRef,存储有6 000种期刊,超过450万篇文献的DOI记录,为用户实现引文到原文的链接提供了便利,为数字信息资源真正实现共享提供了途径。
(6)搜索引擎与学术信息的结合
一方面,以Google为代表的搜索引擎巨头开始将目光瞄准学术信息市场,通过与学术出版商合作以免费的方式为用户提供高质量的、面向主题的搜索服务,例如Google Scholar。另一方面,针对互联网上开放存取资源库,出现了以OAIster和Citebase为代表的开放存取搜索引擎。这两方面的进展对学术数字信息资源公共存取的意义在于:
①符合人们获取信息的习惯。通过搜索引擎获取所需信息是人们最常见、最直接的方式,但是现有的搜索引擎的返回结果大部分质量得不到保障。专业的出版社拥有高质量的学术信息,却难以提供令用户满意的检索方式。Google Scholar等学术主题搜索软件正好填补了两者的缺陷,提供一个传统的搜索引擎界面来获取高质量的学术信息。这种搜索引擎还有个特点是检索结果按照文章被引频次排列,与用户的相关性大大增强。科学的排序原则是Google Scholar使人信服的依据。
②有效地组织了互联网上分布式的开放资源。用户常常抱怨互联网上有价值的信息都是要付费才能获取,而事实上,互联网上已出现许多免费的开放资源,但是缺少一种有效的组织方式,所以才造成用户难以获悉的局面。开发专门针对开放存取资源的搜索引擎成为一个新的技术热点,例如开放存取搜索引擎OAIster就对全球712个机构资源库建立了索引数据库,通过这个搜索引擎能对全球分布式开放资源进行检索。
③搜索引擎不断加强与学术机构的合作。“2004年12月13日,Google宣布将与美国纽约公共图书馆以及哈佛大学、斯坦福大学、密歇根大学和英国牛津大学的图书馆合作,将这些著名图书馆的馆藏图书扫描制作成电子版放到网上供读者阅读。Google Scholar将打造成全球最大的网上图书馆。”[7]Google的举动表明,它在传统数据提供商的基础上建立学术服务的新阵营,打造学术评价的新标准。目前,Google公司已经与许多科学和学术机构进行了合作,如ACM、Naure、IEEE、OCLC等。我国国家图书馆也通过Google向公众开放书目数据,万方数据库、维普资讯数据库等也开始与Google Scholar的合作[8]。
(7)开放存取中产生了新的商业模式
数字信息资源的开放存取依托先进的网络技术和数字技术,相比传统基于订阅模式而言,一方面不需要为印刷、版权管理及其实施消耗费用,另一方面减少了从信息源传播到最终用户的中间环节,所以在开放存取中数字信息资源的出版和传播成本大大降低。这个优点增加了开放存取的竞争性。但是开放存取并非没有成本,在开放存取期刊和自我存档资源库建设中都需要一定的费用。为了弥补运营成本,许多新出现的商业模式可以保障数字信息资源开放存取的顺利开展。
这些商业模式可分为自产收入(Self-generated Income)和内外赞助(Internal and External Subsides)两大途径。其中,自产收入包括作者付费出版、印刷版销售、广告收入、提供副产品、提供增值收费服务等方式;内外赞助包括各研究机构、基金组织、政府以及私人的赞助等。所有这些商业模式都可以作为学术数字信息资源实施公共存取战略的经济补偿机制。
4.威胁
(1)学术数字信息资源的类型不一、标准繁多
数字信息资源区别于传统印刷型信息资源的一个显著特点是表现形式多种多样,有文本、图像、声音、视频等,各种类型又包含许多不同的格式,例如光文本就有.pdf,.doc,.caj等等格式。这种特性给数字信息资源的存取带来诸多挑战。
①异构数字信息资源的集成。分布在不同组织机构中的数字资源在内容结构、元数据描述、检索界面以及检索协议等方面呈现异构性。对用户而言,没有必要也不可能去适应各个资源系统,而是通过互操作机制,提供面向用户的逻辑上统一或相互有机连接的数字信息服务机制,支持用户在整个数字信息环境中有效搜寻、获取和利用信息。这就是数字信息资源集成技术要解决的问题。
②数字信息资源的利用需要相应的配套工具。人们获取一本纸质图书的内容几乎不再需要其他辅助设备,而数字信息资源的利用仅仅获得了数字内容是不够的,还要有一套设备能读取内容。数字信息存储格式的多样化要求人们不断地开发和掌握各种浏览工具,因此,掌握一定的计算机技能是数字时代人们获取数字信息的一项基本技能。
总之,数字信息资源的多样性,一方面需要加强数字信息资源的标准化建设,开发集成化的数字信息系统;另一方面,对数字信息资源的用户培训也要跟上需要。这两方面的工作都是必不可少的。
(2)知识产权与数字信息资源存取的矛盾
知识产权法授予了作者对其数字作品的复制、传播、演绎等方面的专有权,以弥补作者的创作型劳动,并鼓励更多作品的创作。随着知识产权的扩张,在网络时代已被越来越多的利益集团沦为牟利的工具,限制了人们对数字信息资源的存取。这种矛盾体现在:
①知识产权的排他性会导致信息垄断。版权法和专利法确立的目的是保证研究和发展的经济效率水平,保护作者与发明者的知识财产,确保他们所付出的时间和精力得到补偿,以鼓励未来的创造性活动。但是,知识产权法也可能使知识商品的提供者成为垄断者,制定社会无效率的价格,从而造成信息市场的失灵。
②知识产权的保护期限也与数字信息资源的特性不相适应。知识产权法要求对所保护的对象有一定的保护期限,在保护期限内的作品不能自由使用。但是数字信息资源的特点之一是具有很强的时效性,一旦没有及时地获取就可能失去了其价值。所以,从促进数字信息资源利用效率角度来看,现有的知识产权保护期限的规定会阻碍数字信息资源的利用效率。
③知识产权中合理利用的范围过于狭窄。世界各国在知识产权法中都设了“合理使用”的范畴,规定在一定条件下使用他人的作品和发明,可以不经著作权人或专利权人的许可,不向其支付报酬,但应当指明作者姓名、作品名称和出处,并且不得侵犯著作权人或专利权人依法享有的其他权利。合理使用的范围一直是谨慎规定的,尽管这样,许多非营利性图书馆、档案馆和教育机构在教学和科学研究中的使用仍被排斥在外。
④知识产权对数据库的保护不合法,延伸到数据和信息本身。对数据库的保护虽然也有其经济上的合理性,但是这种专有权的设定必然会导致数据库制作者对一些数据的垄断,使公众难以获取信息或者难以从其他不同的途径获取所需的信息。
⑤知识产权保护的技术措施也限制了访问信息资源。使用先进的技术措施来保护数字信息知识产权不受侵犯也是一个重要手段。各种加密、电子签名、电子水印等技术为防止作品被他人擅自访问、复制、传播以及监督作品的使用提供了保障,但也带来了人们利用信息的困难。
(3)信息资源公共存取实现技术的局限
信息技术的发展虽然给数字信息的公共存取解决了许多技术障碍,但是仍有一些技术瓶颈在探索中。
首先,OAI-PMH虽然提供了一个分布式开放资源库存取框架,但是仍有一些技术上的不足。例如,OAI-PMH只规定了不同存档库之间如何交换数字资源的“线索”,并没有规定它们之间如何交换数字资源本身;再者,从网络实现上讲,OAI是基于HTTP协议的,HTTP协议是一种无状态、被动的协议。因此,HTTP协议的许多缺陷自然也就成了OAI的缺陷,如在应用OAI-PMH协议进行互操作的情况下,各个机构存档库之间保持信息同步比较困难。诸如此类问题给OAI-PMH的适用范围带来影响,需要在实践中不断改进。
其次,数字信息的海量存储和管理问题。开放存取模式允许用户自我存档和管理数字信息资源,随着加入开放存取的组织或个人越来越多,存储开放存取信息的服务器将不堪重负。如何保存和管理海量数据是数字信息资源开放存取要解决的任务之一。海量信息的存储需要大容量和高密度的电子贮存设备,包括大容量、高密度的硬盘和光盘以及光盘塔和光盘库。如何对开放存取的信息的存储空间分配、如何组织用户放进开放存取仓储的文件,这些问题都值得深入探讨。
第三,是开放存取信息的检索问题。虽然元数据收割技术在实现语言无关、平台无关、协议无关的互操作方面有较大的进展,部分地解决了开放存取资源在不同语言、不同平台之间互操作的问题,方便用户发现并利用更为广泛的资源,但从用户角度来讲,使用最多的检索工具仍为搜索引擎,搜索引擎的信息检索效率(包括多语种检索、图像检索、语音检索、智能检索)与速度仍是用户满意度提高的重要指标。前面我们看到无论是Google Scholar等类主题式学术搜索引擎服务,还是针对开放存取机构资源库开发的搜索引擎OAIster,其性能都不完善。例如,Google Scholar链接的都是数据库提供者和出版者提供服务的网页,本身并不提供原文服务,对公共存取数字信息资源而言仍然要依赖出版者的开放与否,并且,Google Scholar覆盖的资源数量还是有限的。专业的开放搜索引擎也存在返回结果与用户相关性不大的毛病。所以,如何设计出性能卓越的能搜索开放存取资源的搜索引擎,是数字资源能被公共存取的先决条件。
(4)作者付费出版带来的问题
开放存取的主要经济模式是作者付费出版,读者免费使用。这种模式在实行中会带来诸多问题:作者是否支付得起呢?对于无法支付出版费的科研工作者是否公平呢?开放存取是否会导致科研部门支付的费用超过了以往购买期刊的费用呢?特别在不同的学科,作者对付费的心理承受能力不同。例如在人文社会科学领域,一直以来都没有作者付费出版的传统,与自然科学领域相比能够获得的项目或课题资助也少得多,这些因素都会限制这些学科对开放存取的接受。如果科研工作者发布自己科研成果的费用过高,阻碍贫穷者的创作热情,那么就违反了开放存取的初衷。
除了对科研工作者带来困扰外,对出版商、图书馆等相关利益人也会带来影响。2004年7月21日,英国议会科学及技术人员经过5个月的调查得出“作者付费是确实可行的”,但还需要“进一步验证”。还有一些大学官员担心如果把原本是图书馆经费挪作“作者出版费”后,会进一步缩减图书馆的经费。有些出版商认为即使是按照各个出版社规定的每篇论文出版的费用来收取费用,对一些高质量的期刊仍是远远不能弥补成本的。高质量的期刊意味着高退稿率,带来的是每篇文章出版成本的增加。例如,美国科学公共图书馆的PLoS对每篇论文的发表要求作者支付1 500美元费用,但实际上的成本远远高于1 500美元。如果实施了开放存取,出版商过去是从期刊的订购费中获利,现在就转向靠从出版费中获利。为了获利就只能降低稿件录用标准,这样做的可能后果是整个学术期刊市场论文质量的下降。
如此看来,“作者付费出版”模式的确给学术数字信息资源的公共存取带来了阻碍,学术数字信息资源公共存取战略的实施要考虑到作者付费出版在实际运行中的灵活性,并积极采用其他可行的商业模式。
(5)学术数字信息资源开放存取的质量问题
开放存取的两种实现途径即开放存取期刊和自我存档资源库都不同程度地存在信息质量问题。有些开放存取期刊沿用了传统学术期刊出版流程中的专家评审和同行评议制度,比如BioMed Central期刊刊登的所有研究论文都要经过同行严格评议,SPARC则通过与著名的学会、协会以及大学出版社合作,直接吸收优秀的编辑和专家对出版物的质量进行评估。但是,从Lund大学开放存取目录中收录的期刊来看,具有较高知名度和影响力的高水平期刊很少列入其中。从科研人员的角度考虑,能在著名期刊发表论文是促进其科学研究的巨大动力,通常优先选择在顶级期刊上发表而放弃新兴的免费开放存取期刊。如此一来,只会使优秀的成果仍集中在传统形式的期刊上。
自我存档资源库的信息质量更令人担忧,将成果存于自我存档库中如同人们在互联网上发布信息,除了国家法律法规限制的内容不能发布外,几乎没有其他约束条件。通常只是网站维护人员粗粗判断信息的内容是否满足发表要求,但是由于其并非专业人士,难以对成果的质量做出鉴定。所以不管是个人主页、机构资源库还是学科资源库,都充斥着各种各样的研究成果,格式多种多样,质量良莠不分。
总之,开放存取期刊和自我存档库的质量问题是影响开放存取发展的主要因素。在我国实施学术数字信息资源公共存取战略时,如何建立一套质量控制机制,提高公众能开放获取的数字信息质量,是一项必不可少的战略行动内容。
数字信息资源公共存取战略可以利用SWOT分析工具,结合前文的研究,我们构造了我国学术数字信息资源实施公共存取战略的SWOT分析模型(表7.2)。该SWOT战略分析矩阵是形成我国数字信息资源公共存取战略的依据。
表7.2 我国学术数字信息资源公共存取战略的SWOT分析模型
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。