试论网络信息分类法的构建

>>>  技術話題—商業文明的嶄新時代  >>> 簡體     傳統


  自因特网诞生以来,网络资源日益膨涨,信息可获得量呈几何级数增长,并且表现出分散、无序、变幻多端的特点。无序扩张的网络信息,一方面使网上信息包罗万象,分布组合复杂、垃圾堆积,另一方面,使网络信息用户面对如此海量信息,无法快速、便捷有序地获取所需信息。因此,解决网络信息无序扩张与网络信息有序利用之间的矛盾,有效组织网上信息,变无序信息为有序信息,为网络信息用户提供便利的信息获取途径和方法,便成为网络环境下信息组织与管理的出发点和目的,其核心是信息检索问题。从分类角度检索网上信息资源是人们检索时最常用的方法之一,但到目前为止,对网络信息资源的分类还没有一致的标准和公认的划分结果。因此,网络信息分类方法的研究具有极强的现实意义。如何吸收传统文献分类法的优点,根据网络信息及用户检索需求的特点,依据计算机技术及网络环境,构建科学、实用的网络信息资源分类法是当前信息资源管理研究的重点。
   1 网络信息分类存在的问题及其原因
  人类认识世界的统一性和多样性产生了认识事物的分类方法,分类作为一种科学方法是人们认识客观世界的重要手段之一,其基本职能是知识的整序,即通过“物以类聚”,使知识得以类集,形成知识的有序集合。分类法的主要特点是按学科、专业集中信息,并从知识分类的角度揭示各类信息在内容上的区别和联系,提供从知识分类角度检索资源的途径。
  网络分类其本质是目录分类,它是由网络开发者对所收集的网络资源,进行组织整理,并和检索法集成在一起的信息查询方式。它一般由人工方式采集信息,以某种分类体系为依据,并通常按网络资源的主题性进行分类,将信息资源分为若干领域的主题范畴,然后再细分为各学科专题目录,最后列出具体的相关网站资源,形成一个由信息链组成的树状结构,即总目——专题目录——链接——文本。目前网络分类法的类型主要有:主题分类法、学科分类法、图书分类法和分面组配法。
  网络分类法从其诞生起,就在网络资源组织与检索中发挥了不可取代的作用,显示出强大的生命力,但是其存在的问题也是显而易见的,这主要表现在以下几方面:1.1 分类体系中知识领域不全和知识体系不严密, 不少信息难以归类,同时覆盖面太广,但专指性太差。基本大类可以说是分类法的大纲,是分类体系中的第一级类目。基本大类的设置确定了整个分类体系的基本框架以及所含信息的内容范围。网络分类法设置基本大类时,对知识的系统性考虑不足,更多的是以信息量、信息内容的重要性及其使用频率为标准。大多数网络分类只选取些热点事物作为主题类目,如计算机与因特网、教育、休闲娱乐等。1.2 类目概念划分逻辑混乱,常有隶属关系不清的现象,混淆了概念间的逻辑关系,不利于用户查询浏览。例如,“搜狐”在18个基本大类中,将“计算机与互联网”与“科学与技术”并列;“东方网景”将教育归于自然科学类;“网易”将文学列入历史和宗教类;关于“图书馆”类目,“司南”将其设置为“社会与文化”的下位类;“中国导航”将其设为“教育与科技”的下位类;“常青藤”、“搜狐”将其定义为“参考信息”的下位类;“悠游”则将其安排为“图书出版”的下位类。这种子目设置的随意性,为用户检索制造了障碍,而且,各类分类工具都各自为政,我行我素,没有统一的规范标准。用户必须了解各个网站的分类体系,否则很容易迷航。1.3 类目设置随意,类目划分缺少规范,无规律可寻。 如“搜狐”的教育类,有高等教育,却无中等和初等教育,有国内院校无国外院校,有音乐教育无素质教育,在教育类下,又出现了一个聊天与BBS。 类目划分极为随意,跳跃性过大,这些问题都是缺少严格的词汇控制所致。1.4 类名概念选用不科学。由于网上分类法类型非常多,又存在着同义词和语言表达的丰富性,又没有什么标准对各类分类法的类名进行规范,因此不同分类系统对相同主题,在选用类名时有时相同,有时不同,甚至在同一个分类系统中,对类名的选用还会出现不一致的现象。如,在“常青藤”类表中,“特殊教育”的含义为:残疾人的教育;但在“若比邻”中,则是指计算机辅助教育等内容。这种概念内涵的巨大差异为用户检索人为地制造了不必要的障碍。而且,大多数的网络分类体系没有类目注释,这无疑对类名表义的准确性要求更高。所以,无论从用户检索实用性考虑,还是从分类体系科学性出发,类名概念的科学性都应是各网络分类法必须遵守的原则。
  造成这些问题的原因主要在于网络信息分类体系的设计者。目前网络上的检索工具大都是研究机构、电脑工作者设计的,他们的优势是计算机技术十分精通,熟悉网上信息,重视用户需求,所以设计出的分类体系直观、实用而又易用。但是,他们的弱点是不懂分类学和信息管理学知识,缺少情报检索语言理论的指导,不重视知识体系的完整性和逻辑性,对网上信息的处理较为随意,缺乏逻辑性和科学性。同时传统文献分类法的严密性、等级性、专业性、体系的庞大、内容的陈旧,也使少数试图利用传统文献分类法的电脑设计者望而生畏。从事文献分类工作和情报检索语言研究的图书情报专业人员,其特点是重视知识体系的构建和揭示,强调语汇控制,熟悉分类法、主题法等情报检索语言,熟悉图书馆、情报所等正式出版的纸质印刷型文献环境及其用户,但实际参加网络研究和建设的很少,可以说我国现有的网上信息检索工具还没有一个是图书情报人员设计的,还不能不是一种遗憾。如若电脑工作者同图书情报工作者联手,扬长避短,相信编制一部适用于网络信息组织的分类法并不是可望而不可及的事。
   2 网络分类法的优点
  目前的网络分类体系主要有以下优点:第一,充分考虑网上信息的类型和特点;第二,充分重视网上用户的需求;第三,依托计算机操作技术和环境建构起多维的分类体系。这些优点相辅相成,相互促进。其中,最大的优点是构建了多维的分类体系。网络分类中超文本技术的运用,使网络分类体系在类目间关系显示、类目设置以及相关材料组织等方面比传统分类体系具有更大的灵活性、动态性,并且为分类法的系统展开提供了交互式的友好界面。这主要表现在以下几个方面:2.1 揭示了类目间的多维关系。知识之间的联系是多方面的, 一个主题或事物对象,可以同时从属于两个或多个知识门类,也可以在从属关系以外有其他的联系,即相关关系。传统文献分类法由于其单线型结构,虽然也设置了部分交替类目和类目参照,但仍无法充分揭示主题之间的客观联系。网络分类则采用超文本技术,克服了传统分类法的不足,根据知识门类之间的联系和使用需要,通过链接的方式,在相应的类目下重复反映,充分揭示类目之间的多维联系。2.2 事物多重属性得到充分揭示,多重列类得以真正实现。 知识门类的复杂性来源于其属性的多样化,当依据属性对事物进行归类时就要涉及与相关上位类属性的匹配问题,往往是一个下位类同时与几个上位类的某种属性相匹配。对此传统分类法的解决办法是适当采用多重列类,其目的一方面是为了使事物所具有的多种属性在一个相对较高的划分层次下被同时作为分类标准使用,以避免造成聚类能力的降低。另一方面是为用户提供不同的属性作为检索入口。为了充分发挥多重列类的功能,传统分类法在编制技术上采用了组配法加以辅助,但实践证明,在传统手工标引和检索条件下多重列类和组配技术只能发挥极有限的作用。
  在网络资源的组织中,多重列类的功能发挥了应有的作用。利用链接技术,可以根据需要,有选择地同时建立多个引用次序的类目体系,提供更多的能独立描述信息主题因素的类目,以满足用户检索的不同需要。如网络分类体系中,对文学类作品,同时选择按国家、题材、体裁、时代等为划分标准,通过引用次序的调整,展开多个不同的类目体系。按不同的引用次序设置类目,不仅可以提供不同的检索入口,而且具有建立不同功能的分类体系的作用。2.3 实现了分类体系的动态组织。 动态组织分类体系包括动态设置类目和动态提示类间关系。前者例如,在某体育赛事、节日前,将有关类目提前设置,使分类体系具有较强的动态性、灵活性,方便用户实际使用。镜像类目就是这类动态设类采用的基本形式。所谓镜像类目,是指采用镜像技术,以“拷贝”的方式设置的类目。根据使用需要,通过设置镜像类目,对某些重点类目或热点类目,加以突出反映,使分类法在保持系统性,又不增加工作量的同时,具有较强的灵活性和适用性。根据需要动态调整类目之间的联系,充分反映有关类目之间的关系和变化。如根据动态情况,在一定时期里加强对某些热点类类间关系的显示。对类目联系的揭示还可以扩大到相关的文献资源、检索频道、其他搜索引擎的相关门类。这类类目设置或关系的揭示一旦不再需要,可以随时取消。2.4 体现了分类法的灵活性。传统的分类法具有相当的稳定性, 一般要使用多年才作一次修订,即使修订也往往是缝缝补补,一般不会从根本上改动其体系结构,而且从修订到出版的周期很长,这就使得分类法存在滞后现象,许多新学科、新事物、新概念得不到及时反映。而网络分类法则具有很大的灵活性,可以随时进行结构的调整和类目的增删变更,并能根据网络的需要作较大的改造。
   3 编制网络分类法的基本原则
  网络分类的目的是使无序的信息有序化,以便于用户检索网络信息资源,与传统文献分类法不同,它是一个检索系统而不是一个标引工具。在编制分类法时除了继续发扬、完善其原有优势:类目间关系(横向、纵向)多维性、多重性;类目设置动态性、灵活性等之外,还应加强科学性、兼容性、通用性等原则的建设。3.1 科学性原则。这主要体现在网络分类法的体系结构、 类目设置与划分、类名概念选择上。类目的设置与排序时,必须遵守基本的学科划分和逻辑划分原则。目前网络分类法中,不论是基本大类,还是各级子类的设置都存在着过分的随意性,违背了类目概念划分中的学科性及逻辑性原则,人为地制造了分类体系的混乱,降低了检索效率。
  与传统分类法相比,网络分类中同位类排列顺序的重要性不断降低,但是类目的排列顺序毕竟体现着分类系统的逻辑性和系统性,同时,由于人们的阅读习惯、终端屏幕大小的限制、分页显示各条款目以及信息下载速度和先后顺序等因素的影响,类目的排列与其被引用率有着一定的影响,排在前面的就比排在后面的有更多机会可供利用,因此,对同位类的排列进行有效的科学控制是非常必要的。
  其次,表现为类名概念选择的科学性。类名反映和限定着类目所表达概念的内涵和外延。整个分类体系就是通过类名体现出来的,用户也是通过类名来识别和选择检索路径的,所以对类名的要求通常是:科学、确切和简洁。另外,大多数的网络分类体系没有类目注释,这无疑对类名表义的准确性要求更高。
  另外,注重类目注释的科学性。目前,许多网络分类目录对上位类进行注释,这种作法既可以提高分类法的实用性,又可以节省用户查询和下载信息的时间。3.2 兼容性原则。 体现在各种分类法之间的兼容互换及其与主题法的兼容上。捷克学者托曼(Toman,I)曾深刻地指出:“对字顺主题和分类系统的研究表明,任何一种系统只不过是对同一组织原则进行另一种组合而已”,“当这些系统用于电子计算机时,所有的差别都消失了”。在网络信息资源组织中,分类检索语言和主题检索语言已由原来的泾渭分明、相互对立,转而相互渗透、相互结合。目前,世界上几部大型分类法都在寻求联合,例如,DDC与UDC计划合作编制地区表,希望在国家及地区概念的表达上达到一致。3.3 通用性原则。在网络中应用的分类法必然会跨越国界, 达到国际通用性,这主要表现在两个方面:一是作为网络信息组织工具的分类法几乎都是多语种的,如DDC已被译成30多种语言; 二是它们具有更少的政治和宗教倾向性,如,DDC21版就对第20 版的宗教类作了较大的修订,旨在降低其基督教倾向。
  自从20世纪90年代中期一些试验性的网络分类编目计划在欧美发达国家陆续启动以后,构建网络分类法的可行性已被证明。例如,国际着名的几部分类法DDC、UDC及LCC在网络信息分类中都有成功的经验,特别是DDC网站的显赫战绩,更令人信心倍增。至于我国, 虽然在这一领域刚刚起步,但目前也已经取得补步成绩,如《中图法》已经实现计算机化,并推出了电子版;中国教育与科研网已开始应用《中图法》组织网络信息。总之,网络信息分类法的构建是无可争议的必然。至于如何构建,目前的答案似乎就是将新的软件技术与图书馆传统的分类理论、方法、实践紧密结合起来,传统文献分类法在网络资源组织中的巨大作用由此得以体现。
图书馆学研究长春36~38G9图书馆学、信息科学、资料工作许磊20022002本文通过对网络分类法的优势及其缺点的分析,阐述了网络分类法存在的必要性,探讨了构建网络分类法的基本原则。网络分类法/网络信息组织  Network classification/Network information organizationAfter analyzing the predominance and shortcoming of network classification, this article tells you the necessity ofConstructing network classification and the basic principles of constructing networking classification.许磊,聊城师范学院图书馆 作者:图书馆学研究长春36~38G9图书馆学、信息科学、资料工作许磊20022002本文通过对网络分类法的优势及其缺点的分析,阐述了网络分类法存在的必要性,探讨了构建网络分类法的基本原则。网络分类法/网络信息组织  Network classification/Network information organization

网载 2013-09-10 21:18:15

[新一篇] 試論網絡傳播與記者傳播方式的調適

[舊一篇] 試論網絡社會的實踐與人的主體性
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表