1 问题的提出
分类法的主体是图书分类表,它是用来对图书资料进行分类的“法典”,是分类体系的具体体现。长期以来,无论是DC(杜威分类法),UDC(国际十进制分类法), LC (国会图书馆分类法), CC (ColonClassification冒号分类法),其载体形式都是印刷品,一部分类法就是一本厚厚的大部头工具书,查阅翻检非常不便。DC在最近推出了其机读版,使用户免去了搬运,翻看印刷载体的苦恼。中图法第四版修订中不少有识之士呼吁要同时发行机读版,反映了图书分类法出版的电子化趋势。
但笔者认为,图书分类法仅实现机读化、电子化还是远远不够的。机读化与电子化只是实现了载体的变化,并没有还分类法以其整体性与生动性的面目。因而笔者提出要在有关电子载体的基础上进一步实行程序化,只有程序化才能把图书分类法由一部生硬僵化的分类表变成一个逻辑科学,结构严密,生动活泼的整体。那么什么叫分类法的程序化呢?分类法的程序化是指在机读版分类法或分类法数据库的基础上,通过编写特定的计算机程序,深刻揭示各类目之间的各种关系,能够辅助用户进行分类标引,主题标引及其他工作。这个概念包含了四层意思:①分类法的程序化是以机读版的分类法,或分类法类目数据库为基础,以分类法本身所具有的信息作为程序的数据;②编写高质量的计算机程序代码,尽可能充分地提示分类法类目之间的从属、交叉、并列、矛盾、对立等关系,分类法标引规则应在程序中充分得到反映,以辅助标引人员正确地进行分类主题标引;③分类法程序化的目的就是通过分析揭示类目之间的相互关系运用分类法细致、具体、繁杂的分类标引规则帮助标引人员得出正确的分类号、主题词或关键词;④程序化的分类法不仅要能用于分类标引,还应通过挂载主题词表、关键词、叙词表,帮助人们进行主题词、叙词、关键词标引等等。
程序化的中图法不同于中图法的电子出版物或机读版的中图法。电子出版物仅向读者提供可供阅读、查询、检索的文本数据。机读出版物只是借助于电子媒介、磁媒介把文本数据按一定的数据格式记录下来供人们使用。程序化的中图法则是在电子版机读版的基础上进一步反映了类目之间的各种关系,把中图法的类目表与标引规则结合起来,提供用户各种检索、标引、统计、分析、维护功能。
2 程序化中图法的特点
2.1 程序化中图法可以避免印刷体中的错误, 它有着印刷本中图法不可比拟的优点。它可以从根本上保证分类法的质量,能随时更改、增删分类法中的类目。缩短修订的时间,避免印刷本因排版印刷装订等因素造成的错误。新版本的发行可以通过网络实现,大大地减小了时间后滞。
2.2 程序化中图法将分类标引工作、 主题标引工作从极少数专家手中解放出来。标引工作的特殊性要求标引工作人员要有广博的综合知识、扎实的标引基础和对具体分类法、主题词表的熟练把握。标引工作历来就认为是二次信息服务业中劳动最为密集的工作。程序化的分类法可以通过良好的用户界面的实时帮助系统帮助标引者解决综合知识和标引专业知识的不足,减小标引的技术难度。
2.3 在程序化的分类法中可以实现中图法的一版化, 中图法第三版为了满足不同图书情报部门的需要,发布了“图书本”,“资料本”两个版本,这既增加了出版发行的费用,也给其修订和维护带来了不便。程序化的分类法则可以由用户根据其具体情况,自行确定不同学科的分类级别,由机器根据用户设定自动对类目级别进行取舍,生成详略程度不同的各种版本。这样综合性或专业性很强的图书资料单位就可以根据本单位的文献收藏特点,确定详简程度不同的分类法版本。
2.4 程序化的分类法由于包括了规范化的概念词汇表(概念代码表),规范化的分类词汇表,经规范的关键词表和自然语汇表以及相关的主题词表、叙词表,能实现分类主题标引的一体化,大大提高标引人员的社会劳动生产率。
3 中图法程序化的现实意义
中图法诞生已经25年。这期间科学技术及文献标引工作本身都发生了重大变化。尤其是计算机的广泛应用深刻改变了图书情报部门的面貌,但由于缺少程序化的分类法及辅助标引系统,分类标引工作的手工劳动的现状并没有多大改变,因此中图法的程序化应该提上有关部门的议事日程。研制程序化的中图法有着重大的现实意义。
3.1 中图法的程序化对于分类工作、标引工作的意义。 中图法经过20多年的推广,已经被许多图书馆和情报研究单位所采用,成为我国通用的综合性图书资料分类法。中图法的程序化,必将对我国图书情报部门的业务工作尤其是文献的分类标引工作产生积极的影响。
3.1.1 中图法的程序化能够减少分类标引过程中的主观随意性,提高分类标引工作的准确性。中图法程序通过良好的用户界面、完备的帮助系统揭示类目之间的相互关系,帮助用户确定正确的分类号、主题词等。
3.1.2 中图法的程序化有助于提高文献标引的一致性。 文献标引的不一致常常导致人们的困惑,妨碍信息资源的共享。标引的不一致很大程度上是由于对分类法的片面理解和对分类标引规则的不了解造成的。程序化的分类法通过辅助标引系统进一步引导人们进行客观、科学的标引,从而提高标引的一致性。
3.1.3 借助计算机化的中图法工具, 标引人员能极大地提高分类标引工作的速度。
3.1.4 中图法的程序化有助于实现分类主题标引的一体化。 中图法通过大量的相关的词表帮助实现类号与主题词之间的相互对照,从而实现分类主题标引的一体化。
3.2 中图法对于图书馆导读工作的意义。 我国的许多图书馆用户缺乏基本的图书分类知识,甚至不知分类法为何物。中国图书馆用户一般习惯于从书名、着者的角度去查找资料,这只能适用于查阅已知的文献,但人们的实际情报检索过程往往是根据一定的学科内容或主题内容去查阅资料。由于读者对分类法所知甚少,所以实际上读者很少从分类途径去查阅资料。如果把程序化的分类法引入导读系统,那么这种情况在一定程度上就会得到改善。通过分类法程序,读者只需在计算机显示器上用鼠标点击几下,就可以把自己的情报需求通过分类号明确下来。
3.3 程序化的分类法是计算机辅助标引系统、 自动分类标引系统、分类标引专家系统的基础。现在的辅助标引系统或自动分类标引系统的原理就是在词频统计分析的基础上确定主题词或关键词,据此主题词或关键词与有关分类主题词表进行耦合,从而确定适当的主题词、分类号。显而易见,程序化的分类法是该标引系统的有机部分,很容易发展成为相应的自动、半自动标引系统。专家系统由知识库、数据库、推理机、解释部分和学习部分组成,程序化的分类法可以视为数据库与推理机的有机统一体,是专家系统的基础。我国图书情报界可以在程序化的分类法的基础上开发出适合我国国情的、实用的计算机辅助标引系统、自动分类标引系统、分类标引专家系统。
4 关于中图法程序化的初步设想
4.1 中图法的程序化是一项艰巨的任务, 它的研制成功和使用将是我国文献标引工作的一项重大变革。为了确保中图法的成功研制,应该成立领导小组,申请科研课题经费,协调各方力量共同攻关。
4.2 中图法的程序化既可以作为大型图书馆集成系统的一个模块来研制,也可以作为一个独立的应用程序来开发。关键是其最终结果都应保证具有强大的功能和实用性,能起到辅助标引的作用。
4.3 中图法程序的系统构架。 中图法程序的主要目的在于帮助人们正确地运用中图法进行分类标引,根据有关的主题词表进行主题标引。因此,中图法类目数据库、标引规则库、中图法与各有关词表对照库、中图法类名类号与有关词表对照库是程序的数据主体,能以中图法分类号为各分类法类号、各类词表款目的转换参照物。整个程序就是围绕如何利用这类数据得出正确的中图法分类号、主题词展开的。笔者根据自己编程的初步实践,设计了如下系统构架,供各位同仁参考。
附图
4.4 中图法程序功能模块设计。由上图看出,完整的、 具有辅助标引功能的中图法程序应有如下功能:
4.4.1 浏览、修改、查询、维护各数据库的功能。 这些数据库包括中图法类目数据库、中图法标引规则库、中图法与各有关词表对照库、中图法与其他有关分类法对照库等。这一功能将彻底改变分类法总是滞后的不足,使分类法紧跟时代的脚步,不断适应学科技术的新发展。同时也可以使不同的图书情报单位根据自己的具体情况,选定适合自己需要的详略不同的分类法版本。
4.4.2 根据中图法库与规则库得出准确分类号的功能。如上图1所示。
4.4.3 根据分类号选定适当主题词、关键词的功能。如上图2, 3所示。
4.4.4 根据中图法与其他有关分类法对照库得到其他分类法类号的功能。如上图4,5所示。
4.4.5 根据若干主题词、关键词选择中图法类号的功能。 如上图3,2所示。
4.4.6 根据分类法分类号得到相应中图法分类号的功能。如上图5,4所示。
4.4.7 具有帮助功能。
4.5 中图法程序化中的难点
4.5.1 中图法类目数据库的库结构设计。 合理的库结构设计应满足三个要求:一是要充分反映中图法本身的类目结构以及各类目之间的紧密联系的关系;二是要利于编程,应该在库结构中加一些重要的标识字段,以便能大大简化编程难度,减少计算机的运算时间;三是要使未来类目数据库的数据冗余度最小化。这三者之间是相互联系、相互制约的。如何建立合理的数据结构是设计伊始就要解决的难题。
4.5.2 标引规则、总论复分表、专论复分表的处理。 标引规则在分类法中通过类目关系及注释反映出来,有一般规则和具体到每一个类目的规则两种。怎样把这两者结合起来并在程序中加以揭示以有助于辅助标引,也是一个颇为棘手的问题。总论或专论复分表不同于一般类目,它们是一种辅助复分标准,在实际标引工作中运用时非常灵活。在程序化过程中要对它们妥善处理。
4.5.3 中图法与其他各分类法对照库、 中图法与有关词表对照库的建立。这是一项工程浩大、要耗费大量人力物力的工作,而且技术难度大。国内已有许多单位作了大量工作,例如,文化部的1996年度图书馆科技重点科研项目“计算机文献标引对照系统”(DIPS: DocumentIndexing Parallel System),据报道已能实现多种分类法和汉语主题词表之间的对照转换。可以说是为中图法的程序化打下了基础。
4.5.4 在现行的各类图书馆自动化集成系统中, 尚未见到真正将分类标引与编目结合起来的。程序化的分类法应该将这个问题予以解决,即:将分类标引、主题标引在编目过程中加以实现。如在输入书目数据建库的过程中,能自动或半自动地从输入的数据项中得出分类号、着者号、书次号、辅助区分号、关键词或主题词等。这涉及到汉字切分的问题,可以考虑到书名数据输入时辅以人工切分语词的方法加以解决。
(来稿时间:1998年7月)
图书馆L长沙14~16G9图书馆学、信息科学、资料工作王应解/晏凌20002000本文探讨了《中图法》程序化的必要性与可行性,分析了程序化中图法的特点及其现实意义,最后根据笔者经验提出了《中图法》程序化的基本设想,描述了具体程序的系统框架、基本功能以及存在的一些困难。中图法/分类标引/程序设计/辅助标引On Programming the Chinese Library Classification Wang Yingjie (School of Library and Information Science,Wuhan University) Yan Ling(Wuhan University Library)The paper discusses the necessity and feasibility ofprogramming theChinese Library Classification. Based on hisexperience in the research work, the author gives his systemmodel of the future application. Some difficulties are alsodiscussed in the paper.王应解,武汉大学图书情报学院 430072 晏凌,武汉大学图书馆 430072 王应解,武汉大学图书情报学院研究生。晏凌,在武汉大学图书馆工作。 作者:图书馆L长沙14~16G9图书馆学、信息科学、资料工作王应解/晏凌20002000本文探讨了《中图法》程序化的必要性与可行性,分析了程序化中图法的特点及其现实意义,最后根据笔者经验提出了《中图法》程序化的基本设想,描述了具体程序的系统框架、基本功能以及存在的一些困难。中图法/分类标引/程序设计/辅助标引
网载 2013-09-10 21:49:04