前言
作为Handles系统的主要应用之一,数字对象唯一标识(DOI)在科技文献永久标识和定位方面的价值已经得到了广泛的认同。目前,DOI主要注册和服务机构CrossRef的DOI注册量已经超过2000万,众多出版商已经从以DOI为桥梁的相互链接所促进的流量增长中受益。但值得注意的是,作为数字对象唯一标识,DOI的价值还没有得到充分体现,特别是在传统学术出版数字化的过程中,以及在科技出版物的版权越发得到重视的情况下,DOI在学术出版产业链中的作用远未得到充分的认识和利用。
本论文将讨论学术出版在向数字出版转型过程中所面临的问题和挑战,并着重分析DOI在学术出版产业链条中的作用。
1 学术出版价值链的变化:数字化进程中的问题与挑战
1.1 学术出版价值链的变化
随着信息技术和互联网的发展,在学术出版领域,数字出版打破了原有的产业格局,产业链的上下游之间,乃至于作者、出版商和服务商以及用户之间的关系需要重新界定与调整[1]。
传统的学术出版产业链条比较简单。如图1所示,作者撰写的论文或专业书籍通过出版商或图书馆或直接传递到用户手中。
图1 传统学术出版产业链
而随着网络和数字出版的发展,学术出版产业链趋向复杂化。作者在PIRA International公司[2]对学术出版产业链研究的基础上,总结了目前学术出版的产业链模型。如图2所示,这种产业的复杂性表现在以下几个方面:
(1)一系列的中间服务商开始出现,特别是集成服务商为中小型出版社提供了数字出版平台。同时,也为大型出版社提供服务,如Ingenta和Highwire等。
(2)大型出版商开始向数字化出版迁移。出版商纷纷建设了自己的数字化生产和发行平台,独立提供服务,如Science Direct, Springer Link,并成为最主要的学术信息提供方(图2中双线所示)。
(3)传统的索引和文摘服务也开始提供联机服务,并且为了提升竞争能力,开始建立与原文的链接功能,两两之间的链接协议层出不穷。
(4)搜索引擎开始人规模抓取期刊文章等学术信息内容,并已经成为学术信息信用户一个最主要的信息源之一。
(5)图书情报机构,特别是国家图书馆和国家情报所,也开始通过原文传递或其它版权合作方式提供科技文献服务。如加拿大情报所、大英图书馆等。
如图2所示,一个普通的用户有可能从6种渠道获得同样的内容,包括出版商的网站、文摘服务、订阅服务、集成服务平台、搜索引擎和数字图书馆等。这样,随着数字出版的发展和行业数字化进程的加快,一个简单的学术出版产业链条已经演变成了一个复杂的网络。
图2 数字出版产业链(参考PIRA International[2]的研究,并做修改)
这种复杂性可能导致的结果是,同一内容的印刷本和多种电子版本并行;电子版本存储在不同的地理位置上,隶属于不同的服务商;读者从不同的渠道获得同样的期刊文章。
同时,图2所示意的只是这个复杂网络的一部分。出版商在出版时印本和电子本的协同问题,作者直接参与的非正式出版的预印本和期刊文章之间的对应问题,以及开放获取环境下,同一本出版物内不同单元(如文章)版权处置不一致的问题,都使学术出版图更加复杂。
1.2 存在的问题
这种复杂的网络,对学术出版产业的有效运行提出了挑战。其中,主要问题包括:
(1)如何保证产业链数字内容的一致性
在一个完整的学术出版产业链中,包括作者、出版社、数字内容加工平台、印刷厂、图书馆和网上书店、搜索引擎、读者等众多主体。在学术信息从内容的创建者转移到消费者的过程中,经历了众多环节,数字内容的表现形式发生了众多变化。那么,如何保证数字对象的一致性?如何实现对内容的追踪?如何保证整个环节的信息共享?避免不必要的重复劳动?这其中的关键,首先是要对数字对象进行识别。而目前的状况是,学术出版物在产业链中流转的时候,已经无法对数字对象进行有效识别。例如,很多二次文献中的文章及参考文献引文与出版商的全文无法一一对应,二次文献与一次文献分离。
(2)如何实现对数字对象在产业链中的权利追踪
在产业链中,一个数字对象的版权会发生转移。典型的权利转移涉及授权销售,数字对象的重新组合,翻译,电子化,以及图书馆的合理使用等等。这种权利在产业链的转移过程中,由于缺少对数字对象的追踪机制,使得无论是用户,还是权利人都无法了解数字出版物的版权状态。造成的结果可能是用户对自己所面对的数字内容的版权状态一无所知,而版权拥有者对权利的状态也不能全面了解。
1.3 对现有标准和标识体系的挑战
造成以上问题的关键,是随着产业链的复杂化,原有服务于学术出版行业的标准和规范无法对数字对象进行有效标识,如:
(1)目前的标识体系无法解析到所标识的数字版权本身(ISSN,ISBN都缺乏解析功能),标识和数字出版物本身是割裂的;
(2)无法追踪变更,无法对版权信息进行动态管理;
(3)目前的标识体系只能对出版载体进行标识,而无法标识到用户使用的知识体,如文章,甚至图表等;同时,在一个载体上很难处理不同的版权方案。
因此,尽管ISBN和ISSN仍在图书馆和出版领域起着重要的作用,但数字技术的发展对标识符提出了新的要求,也赋予标识符新的功能。DOI因其在数字版权管理、电子商务和网络信息服务中所具有的独特功能,既被出版界所看重,也为国际图书馆界所关注。[3]
2 DOI的特点及在学术出版价值链中的作用
在这个背景下,DOI的特点决定了它为迎接这种数字时代的挑战提供了重要工具。
2.1 DOI的特点
DOI的工作机制是:每个出版商为其出版的每一个数字对象编制一个含有出版社本身前缀的DOI,并将其附加到文献元数据(Metadata)上,这样DOI就成为数字对象的一部分,始终与该数字对象共存,并在DOI注册中心数据库中进行登记和永久保存,通过解析机制,实现DOI与源数据的链接。
如图3所示,DOI的特点可以归纳为以下几点:
图3 DOI的特点
(1)灵活的命名标准和机制。DOI的前缀有固定的标准和模式,但后缀可以与目前任何现存的标识体系结合。比如,ISBN,ISSN等。这样,DOI可以成为现有标准的有效补充。
(2)可扩展的描述框架。DOI的元数据描述框架可扩展,并可以自定义,因此,可以对任何数字对象,以及数字对象的任何颗粒度进行描述。比如,DOI既可以描述期刊,又可以描述文章,甚至图表;既可以描述电子书,又可以描述科学数据或基因片段。实际上,DOI的应用已经突破了学术出版领域,在音乐版权等方面也得到了应用。这充分证明了其描述框架的包容性。
(3)活的链接。与传统的标识,如ISSN,ISBN不同,DOI在提供唯一标识的同时,还通过DOI基于Handles的解析机制,在标识和所标识的对象之间建立了链接。通过DOI,读者可获取对应的数字对象,或数字对象的题录或权利信息。
总之,DOI标准的开放性、包容性和可扩展性符合目前学术出版发展的要求,同时,其解析功能又为数字对象标识赋予了新的内涵。
2.2 DOI在数字对象标识上的应用
在我国,DOI的概念首先是由从事数字图书馆建设的专家和学者引进并发展的。这与国外的情况有差异。导致这种差异的原因可能有两个:其一,我国在数字图书馆建设方面与国际接轨较早,较快地接受了国外先进的理念,而我国的出版行业在数字化转移中相对滞后;其二、数字图书馆作为出版物的使用单位,在对期刊等资源进行整合时,发现了统一标识问题,而国外新出现的标准和应用,为解决这种问题提供了新方案。但无论无何,我们不能回避这样个主题:DOI是由数字出版的源头驱动的,这就体现了DOI的源头原则。
这种源头原则的主要内涵是:根据DOI的标准和规范,DOI必须由源头确定并维护,这种机制,实际上带来了很多DOI相对其它标识的优点,例如,唯一性问题。在DOI框架下,只有出版商确定的标识是对此数字对象的永久和唯一标识。在源头就对学术成果进行登记和部署,避免了随后的命名体系的混乱。DOI作为在源头确定的唯一标识,贯穿了学术交流过程的始终。
2.3 DOI在数字对象整合中的应用
Norman将DOI在产业链中的作用比喻成传统产业的条形码。他说[4]:广泛接受的、统一的数字对象标识框架的作用可以用条形码比喻。在现实的商品世界中,如果缺少了条形码,会引起商品流程中各个环节的混乱。DOI在学术出版中的作用也是如此。通过在源头确定的DOI存产业链各个环节的应用,可以实现数字对象的有效整合。这种整合在CrossRef建立的基于DOI的引文链接体系中已经得到了体现。
2.4 DOI在权利管理中的应用
权利管理(DRM)不是简单的反盗版,更重要的是如何促进合理使用。而为了实现对数字版权的管理,DRM需要跟踪与数字内容有关的信息,如版权所有者、用户等等。DOI作为数字对象的唯一标识符,保持了版权内容在不同系统中的一致性,同时,DOI还通过解析功能为版权的解决提供了指向。当出版商将其产品版权转让或出售许可时,即数字资源的位置发生了变化,该出版商应将这一资料改变的信息送到DOI系统的服务器,该服务器将自动更新。
在学术出版产业链中,为保证权利信息的透明和合理使用,DOI可以起到以下作用:
(1)促进对作品和版权的拥有情况进行标识;
(2)监测出版物的获取和使用情况;
(3)为版权费用的自动化收取和分发提供基础的数字化架构。
当然,与DOI相连的元数据,提供了与数字对象有关的许多信息,包括版权所有者的信息。因此,DOI必须要与元数据结合,才能实现数字版权的管理。[2]
3 基于DOI的学术出版价值链远景
通过上面的分析,我们可以描绘一个DOI广泛普及情况下的一个产业图景:
(1)链条从研究人员的科研活动开始。研究的基础是科技文献和实验数据。在撰写研究报告和论文的同时,研究人员将DOI作为文献规范的一部分放到参考文献中。
(2)研究人员将该文章投稿。通过评审的稿件会在出版社的数字出版系统中生成。在生成数字出版物的过程中,出版社将利用被授予的前缀,自动生成DOI号码,将DOI号码及元数据在注册机构注册登记。同时,注册机构还将文章后面的参考文献进行核对,补充每篇引文的DOI号码。
(3)把每个DOI解析到出版商所指定的地址,一般是出版商的服务平台。
(4)西方出版商之间存在频繁的并购,一个刊物今天属于ELSEVIER,明天可能属于SPRINGER。商业上的并购,带来的结果是所出版的数字对象在信息服务平台上的切换,这在互联网上,就会产生“死链”或“断链”问题。但在DOI环境下,两个出版商在并购完成后,所需要做的只是将其在DOI上的管理权转移,新的出版商业只要重新确定DOI解析的指向就可以了。
(5)很多小型出版商会将其电子发行或网络出版业务交给一个或多个集成服务商。出版商只要在其解析关系中,确定指向哪家信息服务商,就实现了电子发行权从出版商向集成服务商的转移。DOI的多重复解析功能还能保证一个DOI指向不同的物理位置。
(6)二次文献出版商,包括文摘和索引服务商,可以利用DOI实现二次文献与一次文献的自动对接,既提高了二次文献的服务质量,又提高了一次文献的流量。
(7)搜索引擎对网上文献进行抓取。而DOI作为被抓取内容的一部分,可以提高搜索的链接质量。
(8)最终用户在阅读期刊文章时,不仅可以看到原文,还可以通过参考文献的DOI获取相关的引文信息,并根据DOI及元数据上所附着的权利信息,进行相应的操作。
(9)随着学术出版物标识深度的提高,产业链中的每个环节将可以在图表、书的章节等层次进行相应的操作。
这样,从出版源头确定并建立唯一标识开始,DOI贯穿了学术出版物产业链的始终,保证了在整个过程中对数字对象的唯一识别。
4案例:澳大利亚CAL公司利用DOI进行数字版权服务
Copyright Agency Limited(CAL)是澳大利亚从事版权管理的公司。CAL发现大学教师和学生对数字内容有特殊的个性化需要,而这种需求通过传统的产业链很难解决。
教师和学生在利用传统教科书的同时,需要补充大量的资料,以保证教学效果。这些资料包括期刊、图书、报纸、甚至视频。他们需要的往往是零散的、片段的内容,教师们往往会将这些内容组合起来,形成新的出版物提供给学生。但因为版权问题,这种行为一方面可能使出版商的权利受到侵犯,另一方面出版商的内容又不能得到充分的利用。因此,CAL启动了Coursepack项目[6]。
如图4所示,在Coursepack项目中,CAL以DOI为基础,构建了个性化的学术出版价值链。通过DOI,CAL对出版商的数字内容进行了深层次的标识,从期刊文章到书的章节。教师通过阅览,确定并下载新教材所需要添加的内容,并将内容重新组合,组合的内容将注册新的DOI。出版商可以根据学生的需求,根据所索取的DOI号码,实现按需印刷。CAL在全程通过DOI进行控制,并实现了以下目标:
图4 Coursepack价值链[6]
(1)学生得到了高质量、正版的学术内容;
(2)分散、零散的内容得到了集成,并存集成过程中保持标识的一致;
(3)用户使用量得到了统计,CAL可以据此向版权拥有者支付版权费用;
(4)大学清楚地了解学校对数字内容的消费情况;
(5)书商和印刷设备的服务效率得到提高。
通过该项目,CAL得山的结论是:DOI是驱动澳大利亚数字内容产业发展的重要工具,因为DOI从根本上解决了困扰这个行业发展的一个关键问题,即通过DOI建立了服务于版权服务的基础架构。
5 结论
通过以上分析和案例我们看到,以DOI为基础,可以构造一个完整的从学者到用户再到学者的产业链条。Attanasio[5]在总结DOI的作用时说:在学术出版产业链中使用DOI与在传统的图书商业链条中使用ISBN一样,出版商可以用同样的语言(DOI)和不同的中间商打交道,而中间商也同样与不同的出版商打交道。DOI提升了整个行业的价值,并使用户从中受益。
日前DOI的应用在我国刚刚起步。我国在利用国际先进的标准和技术的同时,还应考虑建立中文的标准和应用,以服务于我国的学术出版业,实现产业链各个环节的共赢。
数学图书馆论坛京5~9,27Z1出版工作张旭20082008
学术出版/DOI/数字对象唯一标识/数字出版
文章分析了学术出版产业链的变化趋势,建立了数字出版背景下的产业链模型,并提出目前产业运转过程中存在的问题。DOI作为一种标准、技术和机制,为学术出版产业的健康发展提供了支持。作者还以澳大利亚CAL公司的案例为基础,分析了DOI在学术出版价值链中的主要应用。
作者:数学图书馆论坛京5~9,27Z1出版工作张旭20082008
学术出版/DOI/数字对象唯一标识/数字出版
网载 2013-09-10 21:00:18