1.1.5 信息检索
信息检索(Information Retrieval)是指将无序的信息进行整理,形成有序的信息集合,并根据需要从信息集合中找出特定的信息的过程。其实质是将用户的检索要求与信息集合中存储的信息标识进行匹配,当两者匹配成功,信息就会被检索出来。
1.信息检索的分类
按照处理信息的手段来分,检索工具可分为手工检索工具和计算机检索工具两种。手工检索工具是指用手工方式来处理和查找文献信息的方式,如卡片目录等;计算机检索工具是指借助计算机等技术手段进行信息检索的方式,如计算机检索系统、国际联机检索系统等。
按照著录方式来划分,检索工具可分为目录、题录、文摘、索引等类型。目录型检索工具主要有国家书目、馆藏书目、联合书目、专题文献目录等;题录型检索工具主要是指一些新刊题录和题录刊物;文摘型检索工具有指示性文摘、报道性文摘、评论性文摘等;索引型检索工具有主题索引、分类索引、著者索引等。
按照报道的学科内容范围划分,信息检索工具可分为包含多学科的综合性检索工具,也包含单学科的专业性检索工具。
2.搜索引擎
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索的相关信息展示给用户的系统。
互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录中。用户查询时,通过层层单击查找。
1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。当时,万维网还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分布在各个 FTP 主机中的文件。根据精确文件名,Archie 将告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页,但和搜索引擎的基本工作方式是一样的,所以Archie被公认为现代搜索引擎的鼻祖。
目前我国主流的搜索引擎有百度、搜搜、搜狗、bing等,这些都是比较综合的搜索引擎。
3.搜索引擎的使用技巧
灵活地使用搜索技巧,能够使搜索到的信息更准确。
(1)学会使用半角的双引号
双引号的作用是精确查找与所输关键词相匹配的内容。如在搜索引擎中输入“计算机网络发展”,将会出现“计算机网络”与“发展”分开的结果。而加上双引号后搜索则会显示完全匹配的内容。搜索的对比效果如图1-6和图1-7所示。
图1-6 加引号前结果
图1-7 加引号后结果
(2)学会使用减号“-”
“-”的作用是去除无关的搜索结果,提高搜索结果的准确性。例如在百度搜索引擎中,需要找“申花”的企业信息,输入“申花”却搜索到很多关于“上海申花”的新闻,这些新闻的共同特征是“上海”,可以输入“申花–上海”(注意:“申花”后要加一个空格)。
(3)学会使用空格
如果要输入多个关键词,中间可以用空格分隔,如“网络 信息 计算机”。