欢迎来到专业的宏发范文网平台! 心得体会 党建材料 工作总结 工作计划 思想汇报 事迹材料 发言讲话 述职报告
当前位置:首页 > 范文大全 > 公文范文 > 正文

常用搜索引擎的比较

时间:2022-03-14 15:27:44 浏览量:

(郑州大学 信息管理系,河南 郑州 450001)
摘 要:文章主要对Google、百度、雅虎中国三种著名的中文搜索引擎进行了分析比较,突出介绍了信息的搜集方式、检索功能、检索结果、检索效能、搜索服务,探索研究网络环境下搜索引擎效能。
关键词:搜索引擎;百度;Google;雅虎
中图分类号:TP391.3  文献标识码:A  文章编号:1007—6921(2009)05—0114—02

随着网络信息呈几何级数式增长,用户获取有用的信息变得越来越困难。搜索引擎是我们日常获取网络信息的常用工具,它对迅速筛选所需信息起到很重要的作用。如今世界上的搜索引擎数以万计,因此,选择合适的搜索引擎就成为重中之重。Google、百度和雅虎中国是目前比较有影响力的三种著名的搜索引擎,本文将对其主要的性能指标进行分析比较。 
1 三种搜索引擎的概况

Google是由斯坦福大学计算机科学系Larry Page和Sergey Brine博士于1998年创建。支持30多种语言检索,包括中文简体和繁体,并有中文Google网页。当输入检索词后,Google每次可以检索30多亿个网页,从众多的网页中选取与检索式匹配的链接,检索效率极高。Google富于创新的搜索技术和典雅的用户截面设计使Google从当今的第一代搜索引擎中脱颖而出。2000年9月,Google开启中文搜索服务,2004年8月在纳斯达克上市,开创了第二代搜索引擎技术。许多权威机构都将其评为最佳搜索引擎。

百度是中国的两位海外留学生李彦宏和徐勇博士创建的中文搜索引擎,它拥有目前世界上最大的中文信息库,总量达到1亿2千万页以上,并且还在以每天几十万页的速度快速增长。2000年1月,百度公司在中国成立了他的全资子公司百度网络技术(北京)有限公司,随后于同年10月成立了深圳分公司,2001年6月又在上海成立了上海办事处。2005年百度在美国纳斯达克上市,成为当年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。

雅虎中国是网站分类目录导航的领头军,它以分类目录、网站检索为主,附带网页全文检索,也是目前最重要的搜索服务网站。雅虎有中文、英文等10余种语言版本,每一版的内容互不一样。可以说,每一种不同的版本都是一种不同的、相对独立的搜索引擎。
2 Google、百度和雅虎中国的对比
2.1 信息搜集方式比较

搜索引擎对网络信息资源的搜集方式有自动、人工和人工自动相结合三种。另外根据搜索时是否要依据相关主题内容分类,又分为一般搜索和分类主题搜索。

百度是最典型的一种自动搜索引擎,Google是一般典型的自动搜索引擎。它们是由一个称为蜘蛛(Spider)的机器人程序,由四部分组成的自动索引,以某种策略在互联网中搜集和发现信息,然后由索引器把搜集到的信息建立索引,根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该搜索引擎的优点是信息量大、更新及时、不需要人的干预,缺点是搜到信息过多,许多无用信息需要用户从结果中筛选。

雅虎是目录式搜索引擎,它以人工方式或半自动方式搜集信息,由编辑员查看信息,然后人工形成摘要信息,并把信息放在事先准备的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因加入了人的智力,所以信息准确、导航质量非常高,不足之处是需要人的介入、维护量大、信息量少、信息更新不及时。
2.2 检索功能

检索功能的强弱是评价搜索引擎功能的一个很重要的指标。搜索引擎检索功能的评价指标主要包括:基本检索、高级检索、目录式浏览检索和其他功能检索。本文将选取其中最具代表性的指标以图标形式进行比较(见表1)。

2.3 检索结果  
检索结果的显示内容与检索界面是否友好也是评价搜索引擎性能的重要指标。检索结果包括相关性排序、显示内容。
2.3.1 相关性排序。Google的检索结果按相关性由大到小排序输出,其相关性判断依据的是检索词在网页中的出现词频、位置,另外一个重要的依据是通过与该网页链接的网页与检索词的匹配程度来判断其相关度大小。

百度采用了词频统计、超链分析和竞价排名相结合的方式对网页进行相关性评价,能够比较客观地分析网页所包含的信息,从而在一定程度上保证了检索结果的相关性。

雅虎检索结果的相关性按其相关度计算,一般的检索工具是通过计算检索词在每个结果中出现次数和出现位置来计算相关度的。对用户来说,只要把网页本身优化好,就能在Yahoo中取得很好的排名。
2.3.2 显示内容。Google搜索结果显示网页标题、内容简介、链接(URL)及网页条目数,匹配的关键词以粗体显示。

百度检索结果的输出除了显示网页标题、内容简介、链接和网页条目数外,还有日前显示、相关搜索显示、这样可以提高用户检全率。

雅虎的检索结果显示包括网页属性,如标题、网址、大小、摘要,并突出用户的查询字符串,便于用户判断是否阅读原文。此外,还包含快速链接,网页快照。
2.4 功能比较
2.4.1 网页搜索服务。中文简体网页搜索方面,不论Google还是百度,在搜索性能和效果方面都很好,旗鼓相当。虽然Google开发了众多的搜索功能并最早推出中文搜索,但由于不太专注中文搜索的开发,在汉语理解、中国人搜索习惯的掌握等方面均要落后于百度。与Google相比,百度更专注于中文搜索,甚至可以说只重视中文简体搜索,所以,提供的中文搜索服务是最全面、功能和性能是经得起长时间考验的。

雅虎界面简洁,使用方法也比较简单,你只有输入想要查找的关键字,点击雅虎搜索在不到半分钟的时间内便可以得到多达数百万项的结果。雅虎默认的设置是搜索中文结果的网页,包括简体和繁体结果。所要检索的关键字可以是词语,也可以是短语或句子。
2.4.2 MP3搜索服务。Google和百度MP3搜索服务包括各种音频文件、Flash和歌词专辑等服务,目前使用最多的是搜索歌曲和音乐服务。刚开始,Google和大多数国外门户网站还未开设专业音乐搜索频道,中国的搜索引擎公司得以抓住机会。其中,百度是开设MP3搜索服务的最大受益者,许多人知道百度是从搜歌开始的,而且许多坚持使用Google的早期网民还保持一个习惯,找网页到Google,搜歌到百度。

雅虎MP3是雅虎的音乐搜索频道,具有海量的歌曲索引数据库。雅虎独有智能搜索引擎,用户可以根据歌名、歌手、专辑名称、歌词来搜索歌曲。在搜索框中输入歌名,然后点击“歌曲搜索”按钮,就可以找到自己想要的歌曲,在搜索框中输入歌手名,然后点“击歌曲搜索”按钮,就可以找到该歌手演唱的所有歌曲。雅虎不仅能搜索中文歌曲,还有强大的搜索欧美歌曲的能力,拥有超过1 000万的欧美歌曲链接数据。
2.4.3 图片搜索服务。Google较早推出图片搜索服务,支持GIF、JPG、PNG等图片格式搜索,支持黑白、全彩形式图片选择,支持大、中、小型图片选择。其搜索结果页面4×5幅图片,同时配有一个针对儿童的不良图片的屏蔽功能,但中文版却未提供此功能。

百度图片搜索结果页面有4×6幅图片,其中一个比较大的特点是支持新闻图片搜索,而且,在搜索结果页面最后一行配有最新的4张相关新闻图片。 

雅虎具有全球最大的图片搜索引擎。图片搜索的方法与网页搜索大体一致,搜索得到的结果是以缩略图形式显示的,还有简单说明,单击缩略图即可看到原始的图片及图片的来源网址。同时雅虎图片搜索还设置了“人气搜索词”“美图精品区”“绝色倾城”等类别,用户可根据需要直接点击查找。
2.5 检索效能

所谓检索效果,就是利用检索系统开展检索服务时产生的有效效果。它衡量了检索结果对用户需求的满足程度是检索系统性能的直接反映。相关评价指标包括检全率、检准率和响应时间。百度和Google是我们经常使用的,在使用过程中我们可以得出结论:百度和Google两者都能较好地解决自动去重,由于都引入网页快照(cache、百度快照)从服务器里直接取出缓存的网页,巧妙地解决了搜索用户经常遇到的死链接问题。而Google查全率明显高于百度,百度特有的高效的搜索算法和本地服务器保证最快的响应速度,响应时间短,在中文检索中检准率较高。

雅虎作为指南型分类检索工具,在相对查全率方面具有优势,检索功能及相对查准率方面还不够理想。
3 结束语   

综上所述:我们可以看出,这三大中文搜索引擎各具千秋,如Google的检索功能强大、灵活,尤其是支持多种字段检索以及网页推荐功能,并可以按用户的习惯设置检索界面;百度收录的中文信息覆盖面广、数量大,更新快;注重服务的本地化;雅虎作为指南型分类检索工具,在相对查全率方面具有优势。我们可以根据各自的生活、工作、学习的需要,选择一种适合自己的搜索引擎,但是现有的搜索引擎也不是尽善尽美,它们也或多或少的存在些问题,希望它们能互相取长补短、不断丰富、完善,更好地满足用户个性化的多元检索需求。
[参考文献]
[1] 于彩云.搜索引擎雅虎的性能评价及评价指标的选择[J]现代情报,2007,(2):185-187.
[2] 徐险峰,谷遇春. 新一代雅虎搜索引擎的搜索功能和使用技巧[J].科技情报开发与经济,2007,(7):219-220.
[3] 吴宏.百度特点与搜索技巧[J].农业图书情报学刊,2004,(3):28-29.
[4] 谈大军.中文Google与百度排序方式与检索效率比较分析[J].现代情报,2005,(3):88-89.
[5] 余翠莉.Yahoo和Google搜索功能比较[J].农业图书情报学刊,2007,(6):109-110.
[6] 薛万新.常用中文搜索引擎的特征分析[J].科技情报开发与经济,2006,(4):209-210.
[7] 黄琛.十大著名搜索引擎特征及比较[J].现代情报,2006,(1):70-71.
[8] 李洪心,李婷.中外搜索引擎比较——Google和百度[EB/OL].www.cit.org.cn.

推荐访问:常用 搜索引擎