首页 理论教育 开放存取与数字学术出版

开放存取与数字学术出版

时间:2022-03-10 理论教育 版权反馈
【摘要】:从开放存取仓储收录的资源来看,根据OAIster的数据,当年仓储资源增长4886516条,涨幅达34%;或者根据Scientific Commons的数据,增长7532473条,与上年相比增长幅度为45%。此外,开放存取仓储的工具也层出不穷。
开放存取与数字学术出版_海外人文社会科学发展年度报告(2010)

一、开放存取与数字学术出版

学术出版作为数字化发展最快的领域,加上其与影响日益扩大的开放存取运动的密切联系,导致其多年以来一直是研究者密切关注的热点问题,并产生了众多有价值的相关研究成果。

1.进展与影响

2008年全世界范围内的开放存取运动无论从深度和广度来看都有更大的发展。1月,美国国家卫生研究院(NIH)颁布政策强制要求对所资助的研究产生的期刊论文实施公共存取,三个月后正式生效。该政策要求所有NIH资助的研究人员必须将其经过同行评议的论文在正式发表以后12个月内将最终稿的电子版存入开放存取仓储公共医学中心(PMC)中。NIH过去两年的科研预算都达到大约290亿美元的规模(超过全球124个国家的GDP值),其所资助的研究每年产生80000篇以上经过同行评议的论文。

因此,这一政策对于开放存取运动的实质性支持作用及其对世界范围内科研资助机构的示范效应都是十分可取的。与此同时,欧洲研究院(ERC)成为首家要求强制实施开放存取的欧盟级别的研究资助机构,而且其要求更为严格:只允许六个月的禁制期(embargo),并将适用范围从同行评议论文扩展到数据(data)层面。在这些大型科研资助机构的带动下,世界范围内的许多高等院校、科研机构或其下属单位开始强制执行开放存取政策。

相应地,研究人员也持续不断地关注开放存取的最新进展。Peter Suber作为较早的倡议者自2003年以来每年均撰写关于当年开放存取进展和影响的综述文章,近几年还在《电子出版期刊》(The Journal of Electronic Publishing)上发表。根据Suber(2008)的判断,2008年开放存取期刊和开放存取仓储比以往任何一年都更加快速地增长。其中开放存取期刊指南(DOAJ)录得当年新增812种开放存取期刊,比前一年增长27%;科学共同体(Scientific Commons)录得开放存取仓储数量增加8%,总计达963个; OAIster录得的数量增加了14%,达1051个;开放存取仓储名录(ROAR)录得的数量增加了28%,达1229个;开放存取仓储指南(OpenDOAR)录得的数量增加了28%,达到1296个。从开放存取仓储收录的资源来看,根据OAIster的数据,当年仓储资源增长4886516条,涨幅达34%;或者根据Scientific Commons的数据,增长7532473条,与上年相比增长幅度为45%。(6)除此之外,开放存取仓储的类型与所涉机构有扩大之势,如一些国家和州县等政府机构开始建设仓储,BiomedExperts、Epsilen和Twidox等许多网络服务机构开始提供仓储服务,各种项目也开始建设项目层面的仓储(Project-specific OA repositories),而且仓储建设逐渐扩展到人文社会科学领域,等等。此外,开放存取仓储的工具也层出不穷。

在评估开放存取运动影响的研究中,Philip M.Davis(2009)运用媒体框架理论(media framing)对2003—2008年世界主流报纸社论和读者来信的分析颇值一观。尽管迄今为止开放存取的种种争论、实践和相关研究主要集中在图书馆界、出版界和学术界,但随着其影响的日渐深入与扩大,逐渐波及一般纳税人,因此了解大众媒体如何架构关于开放存取的议题是十分必要而且有益的。Da-vis的研究发现开放存取的支持者常围绕“透明度”和“公共受托责任”(transparency and public accountability)来架构其论点,即纳税人的钱资助了科学研究,因此公众有权获取研究成果;而公开性和透明度是必要前提。这样的框架简明、有力,并与当下社会推崇开放、民主政府的核心价值理念相呼应。此外,支持者们还成功地构建了制造社会运动所必需的集体行动框架(collective action frames),其中包含三个基本要素,即指出不公平现象(injustice)、号召大家行动(agency)和区分对方身份(identity)。(7)具体来说就是首先强调对造成某种不公平的行为人(此处主要指出版商)我们应具有道德义愤;然后指出如果大家一起行动就可以解决问题;最后,根据某些利益和价值观方面明显的差异区分出敌我双方,即倡导开放共享的“我们”和唯利是图的“他们”(出版商)。相比较之下,以出版商为主的开放存取运动的反对者未能建立起自己的核心框架,其针对支持者框架构建的辩解诉诸出版物质量和出版行为的可持续性,立论主旨过于细小并且缺乏简明的叙事结构。其唯一较为有力的反框架(counterframing)叙事是“政府干预”的说法,即将强制政策和法令视作“政府无理地干涉私营出版业”。(8)显然,此种诉求很容易在推崇自由市场的美国社会获得响应。因此,其与NIH制定较为温和的规定(12个月的禁制期)以及2008年9月美国众议院议员否定开放存取强制政策的提案都不无因果联系。由此可见,在当前形势下历史悠久而近几年似乎声名狼藉的STM出版商除了调整自己确实存在的行为偏差之外,注意媒体议题的架构也是十分必要的。毕竟争鸣和社会运动的目的并不必然是要消灭某一方,透彻地思考出版质量和可持续发展等问题对于开放存取运动的进一步发展也只会带来正面影响。

在似乎不可逆转的开放存取潮流之下,许多出版商对开放存取实施了更为宽松的政策,甚至允许作者存档正式出版的PDF版论文。(9)许多重要的出版商在积累了一定的相关经验以后,已经能够以更加理性的态度来看待开放存取出版。Claire Bird(2008)撰文较为全面地回顾了牛津大学出版社的开放存取出版实验之旅。自2004年以来该社采用开放存取出版模式的《核酸研究》(NAR)收到的投稿量和作者满意度都维持稳定,大部分作者都乐于支付开放存取出版费用,因此新模式下运行的期刊能够做到财务平衡。尽管2005年NAR的收入曾有短暂下滑,但是2007年又开始增加。另外,该社出版的200多种期刊中有70种左右实行了选择性开放存取模式(Oxford Open),即允许作者自行选择是否缴付论文处理费以便其文章立即实行开放存取。在实践过程中,出版社逐渐意识到作者付费的开放存取出版模式并不是对所有学科都适用的。在该社实行选择性开放存取出版的期刊中,一些分子生物学和计量生物学领域的期刊,作者付费论文的比率高达17%~25%;而那些研究者较少得到资助的学科,如数学等基础科学领域付费论文的比率只有5%,人文社会科学领域为2%。(10)也许可以由此推论,未来会根据不同学科和期刊的特点而出现开放存取、订阅存取、延后的免费存取及其组合并存的局面。然而,迄今为止出版社对于开放存取出版模式对订阅、期刊使用和论文引用率等的全面影响还不十分清楚。

对学术资源的了解是利用的基础,随着开放存取出版的蓬勃发展,准确地把握其现状,或者更加确切地说量化地把握现状是十分必要的。尤其像全球每年开放存取期刊和论文产量那样的重要参数,对于计算开放存取文章、期刊和期刊系统的总成本、定价、收入以及评估开放存取出版的可持续发展状况都是十分必要的。一般来说局部数字比较容易获得,比如DOAJ和高线出版社(High-Wire)等都提供在该机构网站上能够获取的开放存取期刊和论文统计数字。但是,一则开放存取论文并不限于在期刊上发表,所谓绿色开放存取即作者存档的论文也是其中重要的组成部分;再则,DOAJ和HighWire尽管是综合性的规模庞大的开放存取期刊门户,但即使就开放存取期刊全文而言,也未必能够搜罗完备。这就需要研究者设计一些精巧的计量方法来进行测算。

芬兰学者Bo-Christer Bj9rk(2008)等人在这方面所做的工作是卓有成效的。他们选取美国科学信息研究所(ISI)和乌利希(Ulrich's)期刊指南的数据库作为主要的样本来源,通过直接计数和抽样调查得出2006年全球出版了23750种左右经过同行评议的期刊,其中包含约1346000篇论文。而此次调查研究更加重要的任务是计算全球在某个特定年份经过同行评议的开放存取论文的产量。Bj9rk分三路调查来获得最终的数字,即2006年金色开放存取期刊论文(无禁制期),有禁制期的开放存取期刊论文以及作者自行存档论文的数量。

对于金色开放存取期刊论文,Bj9rk仍以Ulrich's数据库为主并参考DOAJ数据计算出2006年大约有1735种活跃的(即继续出版没有停刊)、经过同行评审的开放存取期刊,刊载61313篇文章,占当年出版论文的4.6%。考虑到期刊及论文数量逐年增长以及开放存取运动日渐普及的现实该数字有所增大,这与早年间Regazzzi(2004)利用相似的抽样方法对DOAJ所列期刊进行研究所得的数据具有某种程度的一致性。Regazzzi数据表明,2003年和2004年全球分别出版了25380篇和24526篇经过同行评议的开放存取论文,大约占当年全部STM论文的2%。这与汤姆逊公司的调查研究结果也基本吻合,其测算2003年SCI数据库中的开放存取论文为22095篇,约占该库全部论文747060篇的3.0%。对于延迟开放存取和混合型开放存取期刊,Bj9rk通过测算HighWire网站中立即开放存取的期刊和经过一段禁制期才实施开放存取的期刊数之比,将延后开放存取的论文数量分离出来,得出当年大约有8.1%的论文提供滞后的开放存取。平行出版或者说绿色开放存取论文的数量更加难以估计。Bj9rk从Ulrich's符合要求的期刊中成比例地抽出列入ISI数据库和不列入该库的文章,分别为前者200篇,后者100篇,然后利用谷歌搜索引擎系统地搜寻其存入仓储的情况,得出当年大约有11.3%的论文进行了绿色开放存取。综上,Bj9rk认为2006年全球经过同行评议的论文中实施开放存取的约占19.4%。

Bj9rk对于样本的选择基本上是科学和合理的,如其以ISI和Ulrich's期刊为样本库来测算当年同行评议论文总量,以Ulrich's数据为主并参酌DOAJ来获取金色开放存取论文数量等,反映了他对学术期刊出版情况和开放存取资源分布情况的熟稔。尽管其以HighWire论文构成比模拟全球论文构成比的做法可能会导致较大的计算误差,但也是考虑了当前数据可获得性的前提下具有可操作性和一定合理成分的解决方案。另外,研究者对于数据的处理也比较小心,如其对开放存取期刊论文进行抽样计数时,将PLoS等四家出版机构的期刊单独计数,原因是它们都利用作者缴费方式来维持经营,因此造成所出版的某些特定品种的期刊如PLoS One等载文量非常大,远高于平均数。总体而言,尽管局部结论还有可以商榷之处,如其根据抽样调查的结果认为没有一篇论文既在金色开放存取期刊的出版商网站发表,又在某一开放存取仓储中存档,但是Bj9rk等人的研究结果仍然较为可信。

实际上,在数字出版的许多相关领域都十分需要这种量化研究。如果不同的学者和研究机构都能够把此类研究方法、过程和结果以论文和研究报告的形式发表,以便于其他研究者验算、修正和参考,而且能够以年度为单位持续进行此类研究,这对于摸清数字出版和数字学术资源的家底无疑是十分必要和有益的。国外间或有此类耗时费力的研究,相比较之下,国内同类研究更显缺乏。

2.绿色开放存取与金色开放存取

此前一般将开放存取期刊和开放存取仓储视为两条独立的、彼此平行的轨道,没有什么交集。作为实现开放存取的金色和绿色之路,两者各有优劣,一直以来也都各有自己坚定的支持与拥护者以及相对独立的研究(Prosser,2005;Smith,2008;Oppenheim,2008)。但是Stephen Pinfield(2008)指出,近来开放存取期刊和开放存取仓储已经表现出持续互动、共同构成统一的开放存取学术交流系统的潜力。文章提出了三种可能的互动模式:

模式一,仓储到期刊。一般来说,该模式是围绕传统期刊出版过程而产生的。其中作者写作的目的就是在同行评议期刊上发表论文。仓储一般在两个时点上涉入此一过程,即在同行评议发生前的预印本阶段(preprintor“submitted manuscriptunder review”),或者在同行评议完成后的后印本阶段(postprint or“accepted manuscript”)。(11)许多学科领域都存在这样的模式,比如高能物理领域。这种模式之所以可行,原因在于其中期刊的使用和仓储的使用是互补的。一些研究者调查了高能物理学期刊与arXiv、ADS的情况后发现,论文一旦发表,其利用途径就开始从仓储转向期刊。(12)因此,该模式中的期刊与仓储被认为是一种建设性的共存关系(productive coexistence)。(13)

模式二,期刊到仓储。该模式也以传统期刊出版过程为基础,主要区别在于其中的期刊必须是开放存取期刊或者混合型期刊,而仓储涉入的时点发生在期刊出版之后。作者或出版商将记录版本(version of record)存档以后,仓储的作用就凸显出来了,即仓储出于长期保存和重复利用的考虑,会对论文进行格式转变、内容重构和标记(tagging)等一系列后期处理。例如英国公共卫生中心(UKPMC)就将存档论文自动转换为XML格式。(14)在这一模式中,期刊和仓储都负责对内容进行某种形式和程度的加工。实际上,其中的期刊出版者还可以将仓储作为出版场所,直接从自己的网站链入仓储,这就已经接近于模式三了。不过目前出于内容控制权等方面的考虑,此种拓展模式还停留在理论探讨层面。

模式三,仓储到套刊(overlay journal)。关于套刊,Ginsparg早在1996年就提出了相关的概念和构想,此后陆续有一些研究(John Smith,1999;Arthur Smith,2000)。在该模式中作者撰写论文并不是为了在期刊上发表。论文完成后,作者将其存入开放存取仓储。作者可以直接将论文提交相应的套刊,也可以由套刊主动将论文确定为候选稿件。一旦论文被接受,作者可能要根据评议人的意见进行修改,而套刊也可能对论文进行一些编辑加工和处理。一旦仓储中出现了最后版本的论文(由作者或期刊存入),期刊就开始在自己的网站与仓储间创建链接。这种模式在实践中最不成熟,但是也有一些试验性的项目在积极进行尝试,如伦敦大学学院的“套刊档案仓储界面”(RIOJA)等。(15)

以上三种模式有一些显著特点:(1)与传统科学交流系统几乎以期刊为唯一中心不同,仓储也在其中扮演重要角色;(2)期刊,也包括套刊在内蜕变为集结内容的品牌,其主要功能体现为质量控制;(3)论文和期刊不再是一一对应关系,比如一篇论文可以收入多种套刊当中,而且在不同传播阶段可以在不同场所获取。

从现实层面看,金色开放存取和绿色开放存取之路互相补充、渗透,共同提高科学交流效率的远景仍然是可期的。但是,目前这些模式的广泛应用仍然面临一些需要解决的问题,如开放存取仓储的基础设施建设、出版物概念的变化、版本管理、质量保障、资金来源和商业模式、内容保存、政策架构以及学术界各种力量角色的变化,等等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈