技术 > 集成搜索引擎
  搜索引擎是开启网络知识殿堂的钥匙,获取知识信息的工具。随着网络技术的飞速发展,搜索技术的日臻完善,中外搜索引擎已广为人们熟知和使用。任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。一种搜索引擎不可能满足所有人或一个人所有的检索需求。在某些情况下,如文献普查、专题查询、新闻调查与溯源、软件及mp3下载地址搜索等等,人们往往需要使用多种搜索引擎,对搜索结果进行比较、筛选和相互印证。为解决逐一登陆各搜索引擎,并在各搜索引擎中分别多次输入同一检索请求(检索字串)等烦琐操作,集成搜索引擎和元搜索引擎应运而生。
  一、集成搜索引擎
  集成搜索引擎( all-in-one search page),亦称为“多引擎同步检索系统 ”(如:引擎之家)是在一个www页面上链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎,一次检索输入,多引擎同时搜索,用起来相当方便.
  集成搜索引擎无自建数据库,不需研发支持技术,当然也不能控制和优化检索结果。但集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业(如flash、mp3等)搜索引擎集成链接,深受特定用户群欢迎。
  二、元搜索引擎
  元搜索引擎(metasearch engine),是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(the mother of searce engines)”。在这里,“元”(meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为“源搜索引擎”(source engine),或“搜索资源”(searcing resources),整合、调用、控制和优化利用源搜索引擎的技术,称为“元搜索技术”(meta-searching technique),元搜索技术是元搜索引擎的核心。
  元搜索引擎分为并行处理式和串行处理式两大类。并行处理式元搜索引擎将用户的查询请求同时转送给它调用链接的多个独立型搜索引擎进行查询处理,串行处理式元搜索引擎将用户的查询请求依次转送给它调用链接的每一个独立型搜索引擎进行查询处理。
  因特网上冲浪,你也许有这种痛苦经历:利用搜索引擎进行网页搜索时,在第一个搜索引擎中没有找到满意的结果,于是在第二、第三……个搜索引擎间奔波,为找到满意的结果而费时费力。其实,在因特网上已有不少聪明人开发出了一种metasearch技术,即集成搜索,也叫索引搜索,来帮助上网者快速、全面、准确地搜索到自己确实需要的网页。这种技术的特点是:这些网站上集成了许多搜索引擎,你输入一个查询要求,它会将其适当格式化后提交给许多搜索引擎进行搜索,然后将返回的搜索结果进行整理、合并、集成为一个页面,或一份报告,内容就是你要的搜索结果。
  集成搜索引擎的优点是明显的:首先,它在一个网站上同时搜索许多搜索引擎,最终返回的结果被进行了适当的整合,删除了一些不适合和重复的网页,从而大大地节省你的时间、金钱和精力,使搜索变得更有效率;其次,它使你的搜索结果更为全面、准确,也更容易找到符合你需要的结果。
  以下是笔者在因特网上找到的几个较好的集成搜索引擎希望能对你有所帮助。
  1. inqing(http://www.inqing.com/)
  主页设计非常简洁,简单易用。可将搜索结果进行整理、合并、集成为一份报表。它不仅可搜索web页面,还可搜索软件、文件和辞典。
  2.digisearch (http://www.digiway.com/digisearch/)
  集成了18个搜索引擎进行搜索。输入你的查询要求,并限定你的最大搜索时间,选择18个搜索引擎中的全部或任意几个,它就会自动在这些指定的搜索引擎间搜索。
  3. fusion (http://lorca.compapp.dcu.ie/fusion/)
  这个系统允许你在以下六个搜索引擎间平行地进行搜索:altavista、excite、infoseek、lycos、open text、webcrawler,返回的结果将合并为一个页面,从而提高搜索质量。
  4.cyber 411 (http://www.cyber411.com/)
  对于一个想简单地进行搜索的网上初学者而言,cyber 411是一个合适的选择。搜索的结果仅包含每个主页的标题,返回结果的时间较快。最大缺点是:它无法将你的查询要求进行格式化,以便每个搜索引擎都能理解并执行。因此,返回的结果往往是无用的。对有经验的用户而言,它并不是一种理想的选择。
  5. metacrawler (http://www.metacrawler.com/)
  这个集成搜索引擎是比较好的一个。它的搜索过程非常清楚,具有深度,并且有组织,可以进行简单查询或适度复杂的搜索,不失为一个好的选择 硗猓哂幸桓龇浅S杏玫膗ltimate directory (主要目录),你可以在它集成的很多目录中进行垂直web搜索,包括黄页和白页、分类电话簿、公司摘要等。
  6.savvysearch (http://savvy.cs.colostate.edu:2000/)
  这个集成搜索引擎有二十种语言(很遗憾,不包括中文),对于非英语用户非常有用。它的功能也很齐全。在搜索表格中输入你的查询要求,指明你想要选择全部或任意几个搜索引擎、希望每个搜索引擎返回结果的数目等。另外,它也具有非常有用的ultimate directory (主要目录)。
  7.profusion (http://profusion.ittc.ukans.edu/)
  由于具有智能化的搜索策略,profusion提供了最好的集成搜索的环境。对于你的查询要求,可以选择三个最好的搜索引擎、或三个最快的搜索引擎、或全部搜索引擎、或手工选择任意几个搜索引擎来进行搜索。它最具个性化的功能是:经过一次免费注册后,它会对你的查询要求每周或每月返回一个集成网页并用电子邮件通知你某些网页更新了。
  8. mamma (http://www.mamma.com/)
  mamma分析你的查询要求并适当格式化,以便提交到每个搜索引擎或数据库进行搜索。按照你的查询要求,它可以同步搜索多达7个搜索引擎。然后,它将返回的结果组织成一种格式。其缺点是:对返回结果的集成功能非常简陋,欠缺高级选项。
  9.ask jeeves (http://www.askjeeves.com/)
  ask jeeves的特点是搜索速度相当快,很有创造性,但返回结果并不很精确。它对你的查询要求不作格式化,任其自然,然后将之提交到它自己的数据库和alta vista、excite、infoseek、lycos、webcrawler等搜索引擎中进行搜索。
  10. highway 61 (http://www.highway61.com/)
  对于简单的查询要求,利用highway 61,可望获得快速可信的结果。但返回的结果质量不高
  11.dogpile (http://www.dogpile.com/)
  它不仅可搜索web界面,还可以搜索usenet、ftp站点和新闻线索,这是它的一大特点。它具有智能化的搜索程序和易用界面,但缺少其同类metacrawler所具有的对返回结果的集成功能。
  除以上所说的集成搜索引擎外,网友们还可以到all-in-one (http://www.albany.net/allinone/)、searches (http://www.searches.com/)、search (http://www.search.com/)去逛逛,它们各具一些特色,但看来不会比上面提到的更出色了。据笔者的使用体会,建议网友多用savvysearch和profusion搜索,它们会带给你很爽的感觉。