论情报学的互动观

>>>  新興科技、社會發展等人文科學探討  >>> 簡體     傳統


  中图分类号:G350  文献标识码:A  文章编号:1003-6938(2008)01-0023-06
  1 情报学发展史中的三大观点
  美国情报学家Tefko Saracevic认为,到目前为止,在情报学的发展历程中存在三个重要的观点。[1]第一个观点,形成于20世纪50年代,是指信息检索,它提供基于形式逻辑的信息加工。第二个观点是指相关性,它直接对人类信息需求与评估的过程进行定位和联系。第三个观点是指互动性,它可以促进系统与从事信息检索过程的人们直接交流和反馈。
  1.1 信息检索观点
  信息检索观点一直占据着情报学的主流地位,具有悠久的历史。
  “信息检索”一词由Calvin Mooers在1951年首次提出。它是指从非结构化的文献集合中找出与用户需求相关的信息。当前的非结构化数据主要包括文本数据(如新闻、科技论文等)、互联网上大量存在的HTML、XML网页以及一些诸如图像、视频、音频等在内的多媒体数据。
  最初的信息检索系统出现在20世纪60~70年代,它面向小型的科学文摘数据库、法律和商业文献,检索模型为基本的布尔模型和向量空间模型。到了80年代,信息检索技术出现在大型文献数据库中,这样的系统有Lexis-Nexis、Dialog、MEDLINE。90年代,在互联网上出现了对FTP文档进行搜索的系统,包括Archie、WAIS;在World Wide Web上进行的搜索,包括Lycos、Yahoo、Altavista。这一时期也开始了学术机构对信息检索进行的有组织评价,如由美国国防部Defense Advanced Research Projects Agency(DARPA)和美国国家标准技术协会National Institute of Standards and Technology(NIST)联合发起的TREC评价。另外,也出现了诸如Ringo、Amazon、NetPerceptions之类的智能推荐系统以及自动文本分类和聚类系统。
  2000年以后,信息检索领域出现了一系列新的技术。如①为Web搜索服务的链接分析,此时Google开始崭露头角。②自动信息抽取,包括Whizbang、Fetch、Burning Glass。③问答系统(如TREC Q/A track),问答系统的理念是让用户以自然语言问句的形式提出问题,系统返回精确的结果。另外,针对多媒体信息的信息检索也成为研究的热门。它包括图像、视频、声音和音频、音乐等。还有跨语言检索,如DARPA Tides项目以及自动文摘等新方向。[2]
  信息检索观点强调检索方法和技术,今后仍将是情报学中的重要观点。
  1.2 相关性观点
  如果把信息检索观点看成是情报学的基本的或基础的观点的话,那么相关性观点则又提高了一个层次。
  相关性是信息检索乃至于整个情报学中的一个重要、关键的概念,通过对比相关性,我们可以对各种信息检索途径、算法和实践进行评价。简单地说,它是指信息源中的文献与查询之间的一种匹配关系。知识交流学派的代表人物Saracevic认为,情报学之所以成为独立学科,而不再附属于图书馆学或者文献学的原因就在于它开展了相关性的研究,也在于相关性能够解释科学交流中的诸多问题。他认为,相关性是用来反映基于人类信息沟通评价的人(如用户)和信息检索系统之间信息交换效果的属性或标准,他从多个角度出发将相关性分为五种类型,[3]即系统相关性、主题相关性、认知相关性、情境相关性和动机/情感相关性。
  20世纪50年代末人们开始从理论上探讨“相关性”的含义。60年代,人们着重于寻找影响相关性判断的各种可能因素,比如信息源、检索系统、用户、时间与环境等。70年代,部分研究者开展了建立“相关性”理论框架的工作。80年代,研究者们开始从认知的和动态的角度研究“相关性”。90年代至今,对“相关性”的研究基本上延续了认知主义传统,但知识较之上个时代的讨论更加全面。[4]相关性是动态的、多维的、认知的以及可测度的等观点已经成为学术界的共识。
  情报学的相关性观点触及到隐藏在信息检索背后的实质,揭示出情报以及情报学的本质特征。
  1.3 互动性观点
  长久以来,我们在很多情况下已经习惯了被动地接收信息。自20世纪中期以来,促进信息检索发展的大部分努力都集中在将文本表征与检索式表征进行匹配的方法上。然而,近年来,研究人员开始转到研究用户在信息检索中的角色这一方向。在信息检索中引入了互动性,用户可以对信息内容进行选择,快速跳过不感兴趣的部分,有条件地找出信息之间的相关性,从而获得新的信息内容。可以设想,互动性一旦被引入到用户的活动之中,将会对情报学领域带来极大的变化。
  虽然人们对情报学互动性的研究刚刚开始起步,成果并不很多,但互动性在情报学中的影响将会越来越大,它也将成为未来情报学研究的热点。众所周知,信息检索是情报学中最重要的组成部分,它一直是情报学的主要研究领域以及研究人数最多的领域。而就目前来说,国外学者对信息检索中的互动性已经有了较深入的研究,所以,下面我们以信息检索为例,论述情报学中的互动性是如何实现的。
  2 信息检索中的互动性
  在信息检索领域存在两种截然不同的研究方向和观点,即系统中心论和用户中心论。以系统为中心的观点主要关注各种信息检索算法、文献与检索式的表征以及检索技术的发展,并不考虑用户或交互作用。与之相对应,对检索系统使用的认知、互动的研究则体现了以用户为中心的思想。
  2.1 将互动性引入信息检索
  50年代初,明确提出了有关“系统中心论”的研究,迄今为止,它仍然在信息检索研究中占有支配地位。但是,系统方法本身存在许多难以解决的问题。比如无法对信息检索系统进行评估;无法准确理解自然语言等。针对系统方法存在的这些缺陷,研究人员开始将目光投注到信息检索的另一研究方向:以用户为中心。在20世纪70年代,开始出现围绕用户的关注点而建立自己的研究项目。这类例子涉及到的信息需求和利用、信息行为动机和信息检索交互研究在80年代取得了很大进展,人们开始关注认知、交互和处理背景的研究。
  信息检索的互动性是一个很有发展前景的研究范式,它强调信息搜寻的交互特性。也就是说,它旨在对诸如检索策略、检索词的产生和使用以及用户对同一检索问题的连续检索等现象进行更好地理解。这些现象的研究手段包括观察用户的自然生态、话语分析以及其他分析方法,比如放声思维法等。现在人们主要热衷研究的是获得对最终用户和中介搜索的一种理解,这种理解将引导“智能”信息检索系统的发展,智能检索系统起着从信息搜索到最终用户的中介作用。[5]
  2.2 信息检索互动性的概念
  如果我们对用户如何与信息检索系统交互没有某种程度的了解,我们就不能设计出有效的信息检索系统。我们把这种研究用户在直接查阅信息检索系统的过程中的表现研究称为交互式信息检索。[6]还有人认为,信息检索的交互性是指在信息检索的过程中,与信息检索有关的所有主要参与者(如用户、中介和信息检索系统)的互动式的交流过程。[7]这些定义的表述各异,但其内涵基本上是一致的。
  3 信息检索互动模型
  从70年代开始,由于计算机网络技术的进步,信息检索系统逐渐发展成为动态的交互系统。实践中,交互已经成为信息检索系统一个非常重要的特征。到目前为止,情报学领域出现了四种信息检索互动模型。这四个模型分别是:
  ●Saracevic提出的信息检索交互式分层模型;
  ●Belkin提出的信息检索交互的片段模型;
  ●Spink提出的互动反馈和搜索过程模型;
  ●Ingwersen提出的多表征球状模型。[8]
  下面我们分别加以阐述。
  3.1 分层模型
  互动式分层模型从系统、用户走向环境(社会情景),使交互更深入、更全面,是从动态的角度对查寻过程的把握。该模型的基本假设包括:
  ●用户与信息检索系统交互的目的是为了利用信息;
  ●信息利用是与认知以及情境相联系的。[9]
  该模型力图协调“系统中心论”及“用户中心论”这两个方面,以发挥二者的优势,尽量克服二者的不足,显然,这是对传统信息检索模型的完善。
  Saracevic对分层模型的阐释源于信息利用模型,即“获取——认知——应用”(A-C-A)模型。在信息检索中,获取(Acquisition)是指获取信息,这里的信息包含很多种类型;认知(Cognition)是指吸收信息或者基于认知对信息加以处理;应用(Application)则涉及到利用所吸收的信息,同时也基于特定的情境和环境对信息进行处理,以完成当前的任务或解决当前面临的问题。信息检索的互动是用户与系统之间通过界面的对话,该对话可以重复进行,包含了各种反馈类型,其主要目的是影响与用户手头事务紧密相连的信息利用的认知状态。[10]
  Saracevic认为信息检索的互动是发生在几个互相联系的层次或层面上的,每个层次/层面包括不同的元素与过程。在用户方面,包括认知、情感以及情境等层面。在计算机方面,则包括工程、处理以及内容等层面。图1形象地描述了它们之间的互动。
  G9S701.jpg
  图1 信息检索的交互分层模型[11]
  (1)用户方面
  ●认知层面。用户与信息资源进行交互,并依据信息资源构建认知结构,用户对信息资源的解释、判断、吸收以及处理都是基于认知的。
  ●情感层面。用户与之交互的内容包括:他们的意图、信仰、动机、情绪(如挫败感)、期望、满意度、焦虑等。情感是影响用户其他特征变量的主要方面。对情感层面的研究主要集中在分析用户的意图、信仰和动机等内容。
  ●情境层面。用户与当前面临的问题进行交互,该问题导致信息需求的产生以及与之相关联的检索。检索结果用于解决或部分解决该问题,用户根据自己的要求来判断检索结果的有效性。这一层次的研究主要集中于在交互决策时当前问题或任务所受的影响、问题的改变以及对问题的分类等。交互过程中情境可能被重新解释,作为结果的信息需求以及查询也随之更新。
  (2)计算机方面
  ●工程层面。主要包括硬件、各种操作和设计属性以及内嵌的特征,比如容量、性能、处理能力等。
  ●处理层面。主要是指软件。在信息检索中主要是指处理用户层面与计算机层面在交互过程中的文本、查询表达式以及界面等的一些算法或方法。
  ●内容层面。主要是指信息源、信息对象及其表示等,还包括元数据。[12][13]
  在交互式分层模型中,更深层次交互中的认知、情感和情境会经常改变,问题会被重新定义、重新聚焦等。因此,界面层次的交互处理也会改变:例如,挑选新检索词、舍弃旧词、调整检索策略等。换句话说,界面层次与更深层次之间的互动,相互之间有直接的、微妙的影响。从不同资源和不同处理阶段中选择的检索词就反映了这样一种相互影响的关系。变化中涉及到了各种类型的反馈,并且扮演了非常重要的角色。要对互动进行理解,就需要理解各个层次之间的相互影响。[14]
  随着交互的发生,在各要素、用户和计算机之间,也发生了一系列的动态调整。各种类型的反馈导致了检索词的修改。直觉上,我们在与检索系统交互时,为了不同的目的做着不同的事情。分层模型分解出了许多因素,这些因素涉及到不同类型的交互。
  总之,在交互式分层模型中,信息使用的过程就是用户和系统互相适应的过程。在认知层次,用户与系统的输出发生交互,通过这种交互,用户获得了与其问题状态相关的信息。用户与计算机的交互是通过界面的直接交互。用户交互的深入则是在认知、情境以及情感等层面与计算机以及信息资源之间的交互。在界面层次,用户通过界面利用问题表述或查询表达式与检索系统进行交互。分层模型表明在信息检索过程中会涉及到用户的多重维度。Saracevic模型不仅涉及到用户的知识水平、目标、意图、信仰和任务,还包含了用户的环境和状况。这一模型显示了用户环境的复杂性。当然,分层模型也存在一些缺点,比如该模型是一种理论模型,缺乏足够的实证研究,带有语言学和通讯科学分层理论所固有的缺点。另外,该模型还有一个潜在的弱点,即它缺乏对时空效应的描述。尽管该模型没有考虑到检索结果的时效性和反复性,但Saracevic写道:“在信息检索交互时,交互中更深层次的认知和情境方面会经常变化——问题被重新定义、重新聚焦等等”。接下来的两个模型在它们的交互式信息检索中对时间进行了描述。[15]
  3.2 片段模型
  第二个着名的交互模型,称为片段交互模型,由Belkin和他的同事提出。该模型基于他的“知识非常态状态”(Anomalous State of Knowledge,ASK)理论,不同用户的知识水平不同,他们对要检索主题的理解也不同。Belkin认为,信息检索中存在的真正问题不是怎样表示信息对象,而是怎样描述用户的ASK。之所以有信息需求产生,是因为用户认识到自己存在着知识的非常态,以至于无法面对某种问题与情况,而且,用户一般也无法精确描述需要什么来解决这种非常态。
  该模型基于用户信息查询行为的具体过程,认为用户与某个信息检索系统之间的交互是发生在信息查询片断之间的一系列交互。用户不是与系统进行交互,而是与信息交互。在不同的时刻,用户交互的内容是不同的,每种交互都依赖于不同的因素,如用户的当前任务、目标、意图、片段的历史、交互内容的类型以及其他一些可能的因素。不同类型交互的存在是因为它们支持不同的处理过程,如判断、解释、修改、浏览等。Belkin认为,信息检索界面的核心问题是要找出支持不同类型交互和不同类型信息查询策略的最佳方法和方式。关于该模型的形象描绘见图2。
  G9S702.jpg
  图2 信息检索交互的片段模型[16]
  总之,Belkin建立的从扫描到查找的模型由交互的目标(学习—选择)、检索方式(识别—详述)、资源的类型(信息/元信息)三个部分组成,同时指出用户要分担系统的部分责任,强调了用户与系统的交互。它还表明在信息检索交互过程中有许多相同的事件在重复着,重复片段显示出了信息检索交互的循环性、时效性。该模型的优点在于它直接描述了信息检索中的各种处理过程,而不仅仅是匹配。但它在识别个人片断和它们对每个人的影响方面还面临着一些困难,当然,所有的框架模型也都存在这个问题。该模型的缺点在于它缺少对用户信息问题中社会/环境层面的处理。虽然提及了用户任务和目标,但并没有提到这些任务和目标的起源背景。然而,不管怎样,片段模型在为交互式信息检索提供研究框架方面有了很大的跨越。[17][18][19]
  3.3 互动反馈和搜索过程模型
  在当前的这几种交互模型中,Spink的互动反馈和搜索过程模型最全面地涵盖了信息检索交互的复杂性和循环性。Spink曾研究过信息检索的反馈特性,因此,她也关心信息检索交互中的重复性和周期性。她在研究反馈时,将控制论和系统论的观点运用到情报学领域。Spink的反馈模型将时间以及检索时的循环作为信息检索交互中的影响因子。该模型的要素是检索过程、检索策略和时间。这些过程中包含许多次循环。完全在每个检索命令之间的过程称为循环,即在一个检索式和生成下一个检索式之间的时间和过程。在每个循环中,可能会出现许多交互反馈环。这些交互反馈环构成了用户和信息检索中介之间关于如下问题的讨论:
  ●内容相关性反馈(CRF);
  ●检索词相关性反馈(TRF);
  ●量级相关性反馈(MF);
  ●检索策略回顾反馈(TCF);
  ●检索词回顾反馈(TMR)。
  因此,当其中一个参与者给予上面五个主题中的任何一个反馈时,接着就会出现某种判断或行动,则一个交互反馈环就产生了,[20]如图3所示。
  Spink的反馈模型具有显示信息检索交互的循环特性的优点。它的缺点在于它缺乏对认知改变或认知过程的说明。虽然策略、步骤和判断都包含了,但却没有连接那些检索变化过程的手段,比如说作为反馈环结果的选择性策略。[22][23]
  3.4 多表征球状模型
  最早出现的互动模型是Ingwersen的多表征球状模型,该模型集中于发掘所有信息检索过程所涉及的认知元素,包括信息对象、信息检索系统与设施、界面、用户的认知空间以及社会/组织环境等。它是最有用的元模型,提供了信息检索领域中正在发生和涉及到的广阔画面以及不同的方向。
  G9S703.jpg
  图3 信息检索的互动反馈和搜索过程模型[21]
  该模型的主要观点包括:
  ●信息检索交互是一组认知过程的集合,并隐含在信息检索的所有过程中;
  ●用户在与系统的交互过程中完成大量的认知建模。除了系统之外,用户还与信息对象进行交互;
  ●用户的认知空间是一组结构化的且具有因果关系的元素集合,其中用户的认知以及语境是主要的影响因素;
  ●交互是高度动态的。[24][25]
  Ingwersen强调系统与用户的交互,他指出:“信息检索的任务就是协调文本生成者、系统设计者、标引员与信息工作者、信息用户的认知结构,共同解决用户当前的信息需求”。
  Ingwersen尝试从全维的角度来对信息检索过程进行建模。全维角度是指影响用户、与用户交互的所有因素,像检索中介、信息检索系统和信息源等都应该在检索过程中加以考虑。多表状模型如图4所示,这一模型包含了诸如社会环境、检索系统、信息对象、中介和用户等最广泛的影响因素。
  G9S704.jpg
  图4 信息检索交互的多表征球状模型[26]
  Ingwersen将这些影响因素定义为多表征球状模型,提炼如下:[27]
  ●在信息检索过程中冗余是固有的。
  ●冗余表现为:
  ①同一文献可以从不同的搜索引擎或数据库中检索到;
  ②同一文献可以通过不同的检索式检索到。
  ●在上述设想下,对于同一个项目来说,认知会有部分重叠。
  ●这种冗余表明了增加检索效力的机会。
  换句话说,对于用户来说,通过多种检索方式检索到的文献很可能是有用的。
  Ingwersen模型的优点在于整合了交互过程,而它存在的主要问题则是不易从用户认知空间中获得输入信息进行查寻建模。用户认知空间的这四个组成元素(信息需求、问题空间、当前认知状态和工作-任务/兴趣领域)之间的区别是很细微的。例如,如果一个用户用当前的知识观点来表达信息需求,那么我们就不清楚用户是在表达信息需求,还是在表达当前的认知状态。因此,即使可能,进行一次合适的查寻建模也会很难。[28]另外,该模型没有充分说明检索互动中反馈的特性和作用。
  总之,上述四种模型仅仅表述了已成型的交互式信息检索过程的概念。然而,这四种信息检索互动模型并没有说明人与人之间(如用户与信息工作者)、人与检索系统之间以及它们之间的反馈等交互的复杂性,同时,这四种模型也未反映出标引员与组织体系之间的复杂性。它们并不是对这类模型的完整总结,也不是对交互式信息检索的最终描述。它们自身都还存在着许多缺点,随着我们知识的增长,需要我们进行更多地研究。
  情报学面临的最大威胁在于对人和用户的忽视,对系统的过分关注,可能会导致这种情况更糟。所幸的是,人们已经认识到了这一点,开始尝试将系统和用户结合起来。交互式信息检索就是这类研究的一个例子。
  交互式信息检索提供了丰富的研究内容。它包括人类行为要素,但这也需要对信息检索系统如何工作有一个基本的了解,以便在实际工作中,交互式信息检索研究人员可以与信息检索系统设计者进行合作。交互式信息检索的未来在于跨学科的合作和研究领域中。这个问题过于庞大,不是任何一个领域可以单独解决的。交互式信息检索需要心理学、社会学、商学、计算机学、图书情报学和传播学等学科的研究人员一起给予一个完整的描述。只有这样,交互式信息检索研究才会扩展到诸如域分析之类的领域,确定组织和学科对信息检索交互的影响。其他领域的研究,只是近来才开放,包括连续研究模型、用户局部相关性判断的影响研究、对参与者的搜索行为提问、话题焦点的转换、检索策略以及最终用户网上检索等。
  交互式信息检索是一个比较新,但富有成效的领域。由于越来越多的研究人员进入了这个领域,将会有更多的研究来支持更多智能信息检索系统的发展。我们有理由相信,未来情报学研究的热点就在于互动性。
图书与情报兰州23~28G9图书馆学、信息科学、资料工作王知津/江力波20082008
情报学/信息检索/相关性/互动性
On the Interaction View in Information Science文章从Saracevic所认为情报学发展中的三大观点出发,先简单介绍了信息检索、相关性和互动性。接着,从意义、概念、模型三个方面对信息检索的互动性进行了详细阐述。
作者:图书与情报兰州23~28G9图书馆学、信息科学、资料工作王知津/江力波20082008
情报学/信息检索/相关性/互动性

网载 2013-09-10 21:38:34

[新一篇] 論情報學和知識管理的互動關系

[舊一篇] 論情報學的學體化演進嬗變
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表