2015年中国人民大学信息检索618考研真题
2015 年
一、简答题
中国考研网1、百科全书的特点及类型
百科全书是汇集各学科或某一学科的专门术语、重要名词,以词典的方式进行编排,对每一词目都加以全面系统而又客观简明的阐述,并对新的研究成果加以反映的大型工具书。百科全书涉及各个领域,其内容之丰富、规模之宏大、检索功能之完备是其他工具书所不能及的。在各类工具书中,百科全书堪称“工具书之王”。
西方百科全书的编纂可以追溯到古希腊、古罗马时期。古希腊哲学家斯珀西波斯和古希腊哲学家、科学家亚里士多德,编纂过概述各种学问的百科全书式的著作,被认为是百科全书的先驱者。亚里士多德还是最早对科学进行分类的人,他的思想和实践对后世百科全书的编纂有较大影响,人们称他为“百科全书
之父”。到了中世纪,出现了一批具有代表性的百科著作。英国学者钱伯斯,编纂了《百科全书,或艺术
与科学综合大辞典》,概述影响较大,钱伯斯因而被称为“现代百科全书之父”。我国于清朝末年开始编译外国百科全书。百科全书一般具有以下特点:
(1)概括性:百科全书取材广泛,是百科知识的总汇,它用准确精练的语言,系统概述了人类各个知识领域或某个知识领域的基本事实、基本概念和基本理论,提供了各种事物的基本知识、历史和现状。
(2)权威性:著名的百科全书通常设立阵容强大的编辑机构,各条目的编纂,都是由各个领域、各门学科的著名专家学者来完成的,以保证其质量。如《中国大百科全书》总编辑委员会及其下设的各学科卷的编辑委员会,都由我国各学术领域的权威人士组成。
(3)易用性:百科全书集中了日臻完善的编排方式、索引和参见系统,重要条目后都附有参考条目,或在文中注明征引资料的出处等,读者能从多种角度,用最短的时间检索到所需的知识。如《中国大百科全书》就设有七种检索渠道,以供检索与查考,是迄今为止我国出版的所有印刷型工具书中最完备的。
百科全书包罗万象,能为人们提供人类各个知识领域的基本知识,是学习和工作中最常用的、必备的工具书之一。人们往往称之为“没有围墙的大学”、“知识的小宇宙”、“精简的图书馆”。百科全书通常可以划分为以下几种类型:
(1)按内容范围分:有综合性百科全书和专科专题性百科全书。前者如《中国大百科全书》、《简明不列颠百科全书》等;后者如《社会科学百科全书》、《中国企业管理百科全书》、《中国农业百科全书》、《中国医学百科全书》等。
(2)按地区范围分:有国际性百科全书和地域性百科全书。前者如英、美、法、德等国有名的大百科全书,力图反映世界文化遗产和现代成就,具有国际性;后者侧重反映某一地域、某一国家、某一省的各种情况,如《亚洲百科全书》、《加拿大百科全书》、《北京百科全书》等。
(3)按读者对象分:有成人学术性百科全书、成人普及性百科全书和青少年通俗性百科全书。成人学术性百科全书,如《中国大百科全书》、《社会科学百科全书》、《科学技术百科全书》等;成人普及性百科全书,如《环华百科全书》、《中华常识百科全书》等;青少年通俗性百科全书,如《少年百科全书》等。
目前,外国百科全书把5年以上的资料都看作过时的资料,因而很重视修订工作。利用百科全书,可以系统学到某一学科的基本知识,了解各学科的发展水平。
2、元搜索引擎的含义及特点
元搜索引擎,又称多元搜索引擎或集合式搜索引擎。是一种将多个独立搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问同时提交给多个独立的搜索引擎,并将检索结果一并返回给用户的网络检索工具。元搜索引擎没有自己的网页数据库。元搜索引擎通过向其它独立搜索引擎发送搜索请求来处理用户的搜索请求,然后把这些搜索结果按照一定的方式集成在一起返回给用户。元搜索引擎是建立在已有的独立搜索引擎服务之上的一种搜索引擎,可以将它理解为工具书的工具书,它并不直接针对一次网络资源本身,而是利用下层多个独立搜索引擎提供的服务向上提供统一的检索服务,自身不采集文档,也没有索引,只是维护它所管理的搜索引擎的参数信息。它最大的优点是省时,能同时查询多个搜索数据库,检索的综合性、完整性较好。因而,元搜索引擎技术现在成为检索工具的发展方向。
元搜索引擎的特点主要如下:
(1)一次检索可以实现对多个搜索引擎的检索:元搜索引擎定制了调用多个独立搜索引擎的统一界面,将用户递交的提问提交给它可支持和调用的多个独立搜索引擎,因此,用户的一次查询可以同时检索多个独立搜索引擎。
(2)基于独立搜索引擎结果的二次加工:元搜索引擎的结果基于独立搜索引擎的查询结果。除了一小部分元搜索引擎只能简单地直接调用原始的结果页面外,大部分元搜索引擎都会将各个独立引擎的结果回收之后进行相应的整合,排除相同的结果,并按照一定的排序标准,把二次加工和整理后的结果以统一的格式提供给用户。
(3)标明结果记录的来源搜索引擎及相关度:元搜索引擎和独立搜索引擎的很大一个区别在于其检索结果的显示页面。随着元搜索引擎技术的不断发展,一些元搜索引擎在用户提问的页面,与独立搜索引擎几乎没有什么明显的区别。而在检索结果的反馈时,在每个检索结果中都清楚地标明了它的来源搜索引擎,有的还标注了该检索结果的相关度。
元搜索引擎的功能很大程度受独立搜索引擎的限制,而且结构相对比较简单,因此不可避免地存在一定局限性:
(1)检索功能简单:实现检索语法转换的能力是有限的,一般只提供一个公共接口供用户输入查询词,实际查询在各个独立搜索引擎中实现。对于简单的布尔逻辑检索和词组检索,元搜索引擎的检索效果很好,但对于复杂的检索功能,效果并不是十分理想。因此,元搜索引擎一般只支持通用的检索句法,多数元搜索引擎不支持指定字段检索等特殊检索,掩盖了独立搜索引擎中效果较好的高级查询功能,抹杀了各个独立搜索引擎的特功能,也在一定程度上影响了检索效果和质量。
(2)在调用搜索引擎和检索结果的数量上都存在一定的局限:大部分元搜索引擎只支持调用几个主要的搜索引擎,有许多大型搜索引擎被排除在外,影响了信息搜索的覆盖面。检索速度的限制从一个侧面反映出了元搜索引擎在检索结果的数量上的局限性,这也就是意味着只能从各个独立的搜索引擎中检索少量的最符合要求的命中记录,因此必然影响了检索结果的全面性。
(3)在返回结果的精确性方面,元搜索引擎不如独立的搜索引擎:元搜索引擎将一次提问同时检索多个搜索引擎,扩大了检索覆盖的范围,提高了查全率。但其结果主要来自独立搜索引擎查询结果中排名靠前的记录,在一定程度上默认了独立搜索引擎的查准效果,而
目前独立搜索引擎自身在查全率与查准率提高方面存在着各种问题。因此,元搜索引擎在为用户提供更全面、综合的结果的同时,难以控制各独立搜索引擎的无关输出。
3、怎样构造检索表达式
检索表达式,简称“检索式”或“提问式”,是指计算机信息检索中用来表达用户检索请求的逻辑表达式。检索式一般由检索词和各种逻辑运算符组成,它将检索词之间的逻辑关系、位置关系等用检索系统规定的各种算符连接起来,成为计算机可以识别和执行的命令形式。从某种意义上讲,检索式是检索策略的具体体现,或者说是检索策略应用的一个结果。检索式构造的优劣关系到检索策略的成败。检索式质量的高低,将关系到检索策略的应用成败;而检索式的质量,则取决于对用户信息需求的主题是否有全面、正确的逻辑分析,取决于是否全、选准了检索词汇以及是否能合理运用各种连接组配符号对检索项进行组配。检索式主要有逻辑表达式、加权表达式和其他表达式,其中,最为常用的是逻辑表达式。
通常情况下,检索表达式的构造步骤如下:
(1)分析信息需求(检索课题),明确检索要求
这是人们进行信息检索的出发点,不同类型的检索课题,信息需求的范围和程度也不尽相同。在这一环节中,要明确检索目的,明确检索课题内容涉及的主要学科范围和相关概念。在分析课题的基础上,要清楚检索信息的类型,以及要求查文献信息的时间范围、学科范围等,通过以上分析,对检索需求作出全面的认识。操作中应尽可能掌握检索课题的研究背景,了解检索课题所属的学科领域,学术发展史和现状,借助有关工具书来进一步开拓背景材料,以便于选择正确的检索标识和检索范围。利用掌握的资料的相关背景,经过分析、推敲、拓展,发现更多有参考价值的文献线索,再通过这些已知的线索,了解与检索课题有关的学者、科研机构、学术刊物,以增加检索途径,提高检索效率。