欢迎来到专业的宏发范文网平台! 心得体会 党建材料 工作总结 工作计划 思想汇报 事迹材料 发言讲话 述职报告
当前位置:首页 > 范文大全 > 公文范文 > 正文

利用搜索引擎开发图书馆网络信息资源的方法

时间:2022-03-09 15:11:51 浏览量:

(包头市图书馆,内蒙古 包头 014030)
摘 要: 文章阐述了搜索引擎的含义及类型,分析了网络信息资源特点,提出了搜索引擎开发网络 资源的方法及注意事项。
关键词:搜索引擎;网络信息;资源开发
中图分类号:G250.73  文献标识码:A  文章编号:1007—6921(2009)18—0151—02 

随着数字化、网络化的不断发展,特别是互联网的迅速普及,网络信息资源以惊人的速度膨 胀,人们庆幸能够用搜索引擎在几秒钟之内找到信息的同时,也发现了其庞大的数量,动辄 便是上万条、上千万条甚至上亿条,而许多都是一些无用的垃圾信息。如何快速地、有效地 从庞大的网络信息中抽取出潜在的、有价值的信息,使其更加方便地为读者利用,从而真正 发挥出图书馆社会信息中心的作用。本文就利用搜索引擎开发网络信息资源做一粗浅的论述 。
1 搜索引擎的含义和主要类型
1.1 搜索引擎的含义

搜索引擎是基于WWW的信息处理系统,是对网络资源进行标引和检索的工具。它通过一定的 机制和方法对网络信息进行搜索,将搜索到的信息进行理解、提取、组织和处理,由索引器 建立索引,并储存于可供检索的大型数据库中。
1.2 搜索引擎的主要类型
搜索引擎检索系统包括目录型搜索引擎、全文搜索引擎、多媒体搜索引擎和元搜索引擎。
1.2.1 目录型搜索引擎是最早出现的搜索引擎,它以人工方式或半自动方式搜集信息,大 多面 向网站,提供目录浏览服务和直接检索服务。其特点是搜索的信息准确、导航质量高,但信 息量少,信息更新不及时且维护量大。主要以Yahoo、Sohu为代表。
1.2.2 全文搜索引擎是很常用的一种搜索引擎,是利用网络机器人(Robot)自动搜索技 术对 网络各种资源进行抽取、标引、归并、排序,创建可按关键词查询的网页数据库,搜索结果 直接从自身的数据库中调用。其特点是数据量多、数据的涵盖范围大,更新速度有保障,但 返回信息过多,有很多无关信息,用户必须从结果中进行筛选。主要以Google、Baidu为代 表。
1.2.3 多媒体搜索引擎是专门搜索图形、图像、音频、视频、动画等多媒体信息的搜索引 擎, 它与目录式搜索引擎和多媒体搜索引擎部分交叉重合,采用的技术与文字搜索引擎基本相同 ,是用专门的处理工具对多媒体信息进行分析、理解,创建出多媒体信息库。
1.2.4 元搜索引擎是将多个搜索引擎集中在一起,提供一个统一的检索界面,接收并处理 查询提问。元搜索引擎可以同时检索多个独立搜索引擎,大大提高网页覆盖率,可以说是一 种搜索引擎的搜索引擎。
2 网络信息资源的特点
2.1 信息丰富、形式多样、覆盖面较广

网络信息资源内容极为丰富,涵盖了各个学科领域 。来源较广,有正式出版的、非正式出版的,学术机构提供的、个人提供的都交织在一起; 形式也多样化,有全文数据、题录文摘、图片资料、多媒体信息等等。
2.2 学术性和权威性强

网络中各种专业网站和大型数据库都极具学术性和权威性,所收 录的资料全面系统,整理加工专业化,参考价值很高。
2.3 检索快捷迅速

网络信息是通过节点以超文本链接,构成一个立体网状的信息链。人们 无须预先知道某种信息的网址,就可访问分布在世界各地的服务器上的信息,检索快捷迅速 。
2.4 信息时效性强

网络信息的发布省去了传统文献编辑、出版和发行等环节,实现了读者 与编辑不受时空限制的即时交流,读者能够快速查到最新的可利用信息,大大缩短了信息编 辑出版的时间,使信息具有较强的时效性。而纸制资源由于受到出版时间和加工过程等因素 的影响,时效性受到制约。
2.5 信息资源的共享性

网络系统最大限度地突破了时空限制,使读者可以享受网络条件下 “图书馆”信息资源,这样的信息资源与服务大大超过了传统意义上的图书馆馆藏,真正实 现了图书馆资源的共建共享。
3 利用搜索引擎查询网络信息资源的方法

网络文献信息资源纷繁复杂、杂乱无序,因而需要图书馆提供文献信息导航服务。同样,搜 索引擎主要由计算机和网络工作者设计开发,学科之间的差异,使得知识理解能力和处理方 式不同,会导致分类体系不统一、不规范等问题。读者要查的信息明明网上有,但用搜索引 擎就是查不到。图书馆工作人员借鉴传统分类法、目录组织、主题法等理论知识,借助自身 在信息处理方面的优势来构建信息服务系统, 以提高网络信息的有序化程度, 拓展图书馆馆 藏资源,方便读者利用网络信息资源。
3.1 分析检索对象,正确选用搜索引擎

在使用搜索引擎查找信息前,首先要确定想要搜索的对象,如网址的搜索、标题的搜索、主题的搜索、责任人搜索等,然后再考虑搜索引擎的选用。随着各种搜索引擎的不断涌现, 搜索引擎提供的功能也在日趋完善,在查询范围、检索功能等方面各具特色,检索目的不同 搜索引擎不同。如果我们想要找到某个问题的广泛性信息或方向性问题,一般使用Yahoo、S ohu这样的目录式搜索引擎。对于一些细节性问题或带有交叉性的问题,我们可以利用全文 搜索引擎,如Google、Baidu等。
3.2 确定搜索引擎的搜索途经和方式

搜索引擎通常支持分类检索和主题检索两种搜索途径。根据不同的检索目的确定的不同检索 途径,才能达到预期的检索效果。
3.2.1 分类检索是分类搜索是基于人工标引的检索方法。它以科学、实用的分类目录为工 具, 以规范化的自然语言为类名,在对网络信息归纳、概括的基础上,以网站为单元,提供人工 整序的网络信息。分类搜索是循序渐进的检索方法,进行分类检索方式搜索信息时,首先使 用搜索引擎查阅到一个大致的范围,在得到的一些网址中先选出一些具有代表性的网站进 行浏览,包括网页中的一些超链接,直到找到适合的结果。
3.2.2 主题检索也可以称为关键词检索,提供关键词、题名、著者等多种检索途径。选用 的 主题词要明确、适当地反映课题内容,正确表达主题检索,首先要明确检索需求,对检索课 题进行主题分析,从不同角度将其划分为几个最能表达课题内容的概念,分析出最有检索意 义 的主题词;其次要控制主题词的内涵和外延,避免使用专指度过高和主题范围过于宽泛的检 索词。
3.3 正确使用搜索引擎的各种搜索功能

搜索引擎的使用实际上就是对数据库的访问,可以使用数据库搜索的基本语法来组织搜索条 件。搜索引擎通常提供布尔检索、词组检索、截词检索、字段检索、加权检索等检索功能。 但并非每一种搜索引擎均能提供各种功能,每种检索功能在各个搜索引擎中的表现形式也不 相同,需要正确使用搜索引擎的各种搜索功能对搜索内容进行缩小检索范围或扩大检索范围 等操作。
3.3.1 缩小检索范围。网络信息数量非常庞大,当输入检索词时,常常发现返回的检 索 结果是数以万计、亿计的相关网页,绝大多数是对于我们来说是毫无意义的信息,为了提高 查准率,需要缩小检索范围。经常要用的方法有:①减少同义词或近义词等相关词;②增加 限制概念,用“与”(and)将它们连接起来;③使用字段限制,或者限制检索词在指定的 基本字段出现,或者指定辅助字段,限制结果的文献类型、语种、出版国家;④使用适当的 位置算符;⑤使用“非”(not)算符,排除无关概念。
3.3.2 扩大检索范围。为了尽可能全面地搜索相关信息,提高查全率,我们需要扩大检索 范 围。调整策略的方法有:①减少“与”(and)算符,增加同义词或近义词等相关词并用“ 或”(or)来限制将它们连接起来;②在词干相同的单词后使用截词符“?”;③去除已有 的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。
4 搜索引擎开发网络信息需要注意的问题
4.1 选择优质的搜索引擎

优质的搜索引擎数据库容量大,搜索速度快,“死链”、“错 链”“重链”少,信息的来源有一定的可靠性,可以避免一些粗制滥造的无价值信息。
4.2 选用多种搜索引擎

各种搜索引擎数据库采集的信息都有各自的特色,尤其是一些专业 信息,只使用一种或几种搜索引擎,很难找到真正的信息源。因此,联合选择多种搜索引擎 ,可以提高信息资源的获取量。
4.3 开发特色网络信息资源

对网络资源的开发要根据本馆的性质、任务、服务对象、发展 目标等进行,同时充分考虑本地区社会发展和学术研究的需要,确定网络资源的收集方向, 有的放矢,提高网络信息的准确性和价值性。
4.4 注意知识产权的保护

图书馆网络信息资源的开发必须维护《著作权法》,遵守《 中华人民共和国计算机信息网络国际互联网管理暂行规定》等与知识产权有关的法律。
5 结束语

利用搜索引擎开发图书馆网络信息资源,不仅能够实现图书馆的网络化、现代化,而且为网 络信息搜集与整理创造了一个的可持续发展的空间。不同性质的图书馆,可以建立具有各自 特色的网络信息库,而图书馆馆员同样可以根据读者的咨询信息,有针对性的进行个性化的 服务。
[参考文献]
[1] 马文峰人文社会科学信息检索[M]北京:北京图书馆出版社,2004.[ZK) ]
[2] 张兴华搜索引擎技术及研究[J]现代情报,2004,(4).
[3] 郭瑞华关于搜索引擎打造网上图书馆的思考[J]图书情报工作,2007, (7).
[4] 谢筠基于网络信息资源的有效组织管理与利用[J]科技与管理,2005, (2).
[5] 陈永选, 郑乐丹基于网络的图书馆信息资源整合模式研究[J]图书馆工 作研究,2008,(5).
[6] 林敏网络信息资源组织与检索的分类——主题——自然语言一体化研究[J ]情报探索,2005,(2).

推荐访问:信息资源 图书馆 利用 搜索引擎 方法

猜你喜欢