首页 理论教育 语义出版和基于的出版流程再造

语义出版和基于的出版流程再造

时间:2022-03-10 理论教育 版权反馈
【摘要】:同时,语义出版也引起了许多研究者的兴趣。Web3.0是数字出版发展所面临的最新阶段。Shotton认为语义出版能够提高论文被自动发现的几率,促成有语义联系的相关论文间的链接,保证以可激活的方式存取论文内部数据,或者促进不同论文间数据的整合。
语义出版和基于的出版流程再造_海外人文社会科学发展年度报告(2010)

四、语义出版和基于XML的出版流程再造

随着技术的飞速发展,数字出版从最初将传统出版物简单数字化的阶段发展到了语义出版阶段。近两年来,一些居于领先地位的出版商和利益相关者在语义出版方面进行了有益的尝试并积累了一些经验。同时,语义出版也引起了许多研究者的兴趣。

Web3.0是数字出版发展所面临的最新阶段。Sudeshna Das(2009)认为简单地说Web3.0就是增强了语义功能的Web2.0,对于数字出版而言意味着“社区+语义”,即通过社区用户分享语义,网络成为数据、信息和知识交换的媒介。在这一思路的指导下,他们利用Web3.0技术,即社交网站技术、语义网络技术和文本挖掘技术设计了模块化的小型软件“科学合作框架”(Science Collaboration Framework,SCF)。学术界可以用它来出版复杂的科技论文,成员可以登录各个研究兴趣小组并参加讨论。使用该软件的第一家网站StemBook(26)于2008年9月开始运行,主要出版经过同行评议的有关干细胞生物学的开放存取论文。自发布以来,该应用软件的使用者队伍持续扩大,而且那些以SCF平台为基础建立的网站之间,以及与其他语义网上的站点之间可以实现互相操作。在这一新范式之下,不同学科之间的人为障碍显著减少,可以采用更加灵活和动态的方式交流信息。

David Shotton(2009)也指出语义出版能够极大地提高科学交流效率,许多出版机构都渴望彻底地实施语义出版,但是当前有必要采用稳妥的渐进的方法来推进这一新型出版方式。Shotton认为语义出版能够提高论文被自动发现的几率,促成有语义联系的相关论文间的链接,保证以可激活的方式存取论文内部数据,或者促进不同论文间数据的整合。具体来说,增强语义的措施包括采用超链接、文本术语的语义标记并建立其与相关信息的链接、互动图表、可以重新排序的参考文献以及两种新措施,即基于上下文的引用以及标签树。在分析了在线期刊出版的优劣以后,Shotton还探讨总结了当前语义出版的可行性和实施原则。

W.McCarty(2003)曾经指出:“学术出版是各种互相高度依赖的要素所组成的系统的一部分。其中任何一个要素的改变……都会在系统层面产生反应。因此,如果注重实效,就必须处理好整个系统。”(27)语义出版给出版活动的承担者如作者、编辑和出版商带来了不同的挑战,同时也必将深刻地改变出版的工作流程。Pablo F.Fernicola(2009)探讨了在论文写作阶段引入语义信息和元数据的必要性和可能性,他指出基于XML的字处理文件格式可以提高出版物的互操作性,并在从投稿、评议、出版和存档的全过程中以文件形式保存内容语义和元数据。因此最近几年很多字处理软件都发布了可以直接产生XML原生文件格式(native file format)的版本。其中Fernicola重点探讨了目前正在接受学术界和科技出版界评估的Word 2007论文创作插件(article authoring add-in)及其测试版。该插件能够保证在创作阶段就添加语义信息和元数据,此外,它还能够在出版和存档过程中提供字处理文件与美国国家医学图书馆(NLM)定义的XML格式文件之间的双向全保真的文件转换。Stefan Gradmann等人(2008)则重点探讨了人文社会科学领域(SSH)从数字出版向XML出版转型的趋势,以及在此过程中“文本”等基本术语含义的改变与出版流程的改造。

迄今为止,大部分出版商采用的都是出版后期(post-production)XML工作流程,即将InDesign、Word或PDF文件导出/转换为XML文件。不过这种解决方法是局部的、过渡性的,尤其从成本效益的角度来看并不可取。目前有不少可以改变工作流程的软硬件工具,但是随之而来的转变组织结构和更新工作流程方面的挑战很容易使许多出版社却步,尽管这一步是出版商们必须跨越的。为此,Mike Shatzkin(2008)和他的合作伙伴开展了名为“从XML开始:原因与方法”的项目(Start with XML:Why and How),他们采用商业案例、访谈等方法来探讨相关关键问题并寻找解决方案。基于对出版行业的了解,Shatzkin指出为了以一种成本效益最高的方式抓住浮现中的收入机会,图书出版商必须采用一种从一开始就基于XML的工作流程。也就是说,出版内容应该从尽可能早的时候就以结构化的XML文件的形式存在,其中包含关于文件结构、内容本身、权利信息以及所有组成成分的元数据。

对于出版商而言,XML工作流程具有高效、独立、灵活、多样性、连贯性和便携性等特点,它意味着内容一旦创建,就有可能全部或部分地在不同的平台上出版。如全球领先的大众出版商Simon&Schuster就建立了基于XML的出版系统,能够为出版合同及与版权的使用、销售或内容发行有关的各种工具提供“粒状数据”(granular data)。《出版商周刊》等行业期刊对此有广泛的报道,比如对在该领域拥有专门技术优势的印度公司,(28)以及美国本土成功的商业案例(29)等在最近一两年都有持续跟踪报道。它也逐渐引起了越来越多出版商和研究人员的注意。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈