计算机情报检索

利用计算机从众多的文献资料中找出符合特定需要的文献或情报的过程,目前已成为科技情报现代化的核心内容。

计算机情报检索可以从不同的角度来分类。

按存贮情报内容的表现形式,可以分为:

(1)数据检索:存贮的信息是数据,检索时要搜索数据资料档,并针对提问输出答案。

(2)事实检索:存贮的信息是各种事实,检索时可以对被检索的事实作某种逻辑推理,进行比较和分析,然后再输出答案。

(3)文献检索:存贮的信息是文章标题、著录项目和关键词组成的文献单元,检索时,按提问检索词查找文献资料档,输出文献题录和文摘。

按存贮情报内容的时间,可以分为:

(1)现刊检索:检索时可提供当前现刊上的情报。

(2)追溯检索:检索时可追溯若干年前的情报。

按计算机检索的方式,可以分为:

(1)脱机检索:检索时利用计算机作批处理。

(2)联机检索:检索时利用计算机的近程或远程终端进行人机联作。

计算机情报检索工作开始于20世纪50年代初期。1954年,美国海军军械试验站图书馆利用IBM-701电子计算机建立了世界上第一个计算机情报检索系统。1959年,美国H.P.卢恩利用IBM-650 电子计算机进行计算机定题情报检索服务。60年代,在图书情报工作中广泛利用计算机脱机批处理系统进行情报检索。1962年,美国M.M.凯塞尔利用IBM-7094电子计算机及其多道控制台进行了世界上最早的联机情报检索试验。1964年,美国系统发展公司(SDC)研制成功 ORBIT(On-Line Retrieval ofBibliographic Information-Time shared)联机情报检索软件。70 年代以来 ,联机情报检索有了进一步的发展,并向计算机网络过渡。联机情报检索系统除了上述的ORBIT之外,还有美国国家医学图书馆的MEDLINE系统、美国洛克希德公司的DIALOG系统。与此同时,法国、英国、日本、加拿大也先后建立了联机情报检索系统,如欧洲空间组织情报检索中心的ESA-IRS系统。

中国从 1963 年开始进行机械情报检索的研究工作。1965年进行了机械情报检索试验。70年代以来开始研究计算机情报检索。1975年进行了首次计算机情报检索试验。1977年进行了计算机联机检索试验。1983年在中国科学技术情报研究所建立了连接美国、欧洲主要国家的数据库联机检索系统,这个系统通过意大利的ITALCABLE分组交换中心连接到欧洲空间组织的ESA-IRS系统,并由数据交换网转接到美国的DIALOG、 ORBIT系统,这样,中国就可以在北京利用通信卫星检索到欧美 200多个数据库的几千万篇文献。目前,不少单位在建立各种汉字文献库,有的单位在研究自动标引和自动作文摘的问题。

语言是信息最重要的载体,是科学技术情报的主要负荷者,文献语言研究的深度对于情报检索的效率有很大的影响。在词汇方面,如果深入地分析文献的主题内容,从文献中抽取出足够的检索词,文献标引的范围就比较大,检索时就能把相关主题的文献查出来,从而提高情报检索的查全率。如果突出检索词的专指性,使其能准确地揭示文献的主题内容,检索时就不必再到其上位词或其他专指性较低的词中去查找,从而提高情报检索的查准率。在句法语义方面,如果从语言学的角度揭示了检索文章的主题中各个检索词的句法语义关系,就不易造成误检。

目前,计算机情报检索一般采用逻辑式提问,这给用户带来许多不便,因为用户不熟悉逻辑式这样的不自然的提问方法。如果计算机能理解自然语言的含义,让用户直接采用自然语言提问,就可以大大地方便用户,有利于计算机情报检索的推广和应用。而要用自然语言直接提问,就必须把自然语言的句法和语义加以形式化,使计算机能予以分析和理解。语言研究是情报检索系统中一个不可缺少的方面。

热门点击
最近更新