技術 > 集成搜索引擎
  搜索引擎是開啓網絡知識殿堂的鑰匙,獲取知識信息的工具。隨着網絡技術的飛速發展,搜索技術的日臻完善,中外搜索引擎已廣為人們熟知和使用。任何搜索引擎的設計,均有其特定的數據庫索引範圍、獨特的功能和使用方法,以及預期的用戶群指嚮。一種搜索引擎不可能滿足所有人或一個人所有的檢索需求。在某些情況下,如文獻普查、專題查詢、新聞調查與溯源、軟件及mp3下載地址搜索等等,人們往往需要使用多種搜索引擎,對搜索結果進行比較、篩選和相互印證。為解决逐一登陸各搜索引擎,並在各搜索引擎中分別多次輸入同一檢索請求(檢索字串)等煩瑣操作,集成搜索引擎和元搜索引擎應運而生。
  一、集成搜索引擎
  集成搜索引擎( all-in-one search page),亦稱為“多引擎同步檢索係統 ”(如:引擎之傢)是在一個www頁面上鏈接若幹種獨立的搜索引擎,檢索時需點選或指定搜索引擎,一次檢索輸入,多引擎同時搜索,用起來相當方便.
  集成搜索引擎無自建數據庫,不需研發支持技術,當然也不能控製和優化檢索結果。但集成搜索引擎製作與維護技術簡單,可隨時對所鏈接的搜索引擎進行增刪調整和及時更新,尤其大規模專業(如flash、mp3等)搜索引擎集成鏈接,深受特定用戶群歡迎。
  二、元搜索引擎
  元搜索引擎(metasearch engine),是一種調用其它獨立搜索引擎的引擎,亦稱“搜索引擎之母(the mother of searce engines)”。在這裏,“元”(meta)為“總的”、“超越”之意,元搜索引擎就是對多個獨立搜索引擎的整合、調用、控製和優化利用。相對元搜索引擎,可被利用的獨立搜索引擎稱為“源搜索引擎”(source engine),或“搜索資源”(searcing resources),整合、調用、控製和優化利用源搜索引擎的技術,稱為“元搜索技術”(meta-searching technique),元搜索技術是元搜索引擎的核心。
  元搜索引擎分為並行處理式和串行處理式兩大類。並行處理式元搜索引擎將用戶的查詢請求同時轉送給它調用鏈接的多個獨立型搜索引擎進行查詢處理,串行處理式元搜索引擎將用戶的查詢請求依次轉送給它調用鏈接的每一個獨立型搜索引擎進行查詢處理。
  因特網上衝浪,你也許有這種痛苦經歷:利用搜索引擎進行網頁搜索時,在第一個搜索引擎中沒有找到滿意的結果,於是在第二、第三……個搜索引擎間奔波,為找到滿意的結果而費時費力。其實,在因特網上已有不少聰明人開發出了一種metasearch技術,即集成搜索,也叫索引搜索,來幫助上網者快速、全面、準確地搜索到自己確實需要的網頁。這種技術的特點是:這些網站上集成了許多搜索引擎,你輸入一個查詢要求,它會將其適當格式化後提交給許多搜索引擎進行搜索,然後將返回的搜索結果進行整理、合併、集成為一個頁面,或一份報告,內容就是你要的搜索結果。
  集成搜索引擎的優點是明顯的:首先,它在一個網站上同時搜索許多搜索引擎,最終返回的結果被進行了適當的整合,刪除了一些不適合和重複的網頁,從而大大地節省你的時間、金錢和精力,使搜索變得更有效率;其次,它使你的搜索結果更為全面、準確,也更容易找到符合你需要的結果。
  以下是筆者在因特網上找到的幾個較好的集成搜索引擎希望能對你有所幫助。
  1. inqing(http://www.inqing.com/)
  主頁設計非常簡潔,簡單易用。可將搜索結果進行整理、合併、集成為一份報表。它不僅可搜索web頁面,還可搜索軟件、文件和辭典。
  2.digisearch (http://www.digiway.com/digisearch/)
  集成了18個搜索引擎進行搜索。輸入你的查詢要求,並限定你的最大搜索時間,選擇18個搜索引擎中的全部或任意幾個,它就會自動在這些指定的搜索引擎間搜索。
  3. fusion (http://lorca.compapp.dcu.ie/fusion/)
  這個係統允許你在以下六個搜索引擎間平行地進行搜索:altavista、excite、infoseek、lycos、open text、webcrawler,返回的結果將合併為一個頁面,從而提高搜索質量。
  4.cyber 411 (http://www.cyber411.com/)
  對於一個想簡單地進行搜索的網上初學者而言,cyber 411是一個合適的選擇。搜索的結果僅包含每個主頁的標題,返回結果的時間較快。最大缺點是:它無法將你的查詢要求進行格式化,以便每個搜索引擎都能理解並執行。因此,返回的結果往往是無用的。對有經驗的用戶而言,它並不是一種理想的選擇。
  5. metacrawler (http://www.metacrawler.com/)
  這個集成搜索引擎是比較好的一個。它的搜索過程非常清楚,具有深度,並且有組織,可以進行簡單查詢或適度復雜的搜索,不失為一個好的選擇 磽猓哂幸桓齜淺S杏玫膗ltimate directory (主要目錄),你可以在它集成的很多目錄中進行垂直web搜索,包括黃頁和白頁、分類電話簿、公司摘要等。
  6.savvysearch (http://savvy.cs.colostate.edu:2000/)
  這個集成搜索引擎有二十種語言(很遺憾,不包括中文),對於非英語用戶非常有用。它的功能也很齊全。在搜索表格中輸入你的查詢要求,指明你想要選擇全部或任意幾個搜索引擎、希望每個搜索引擎返回結果的數目等。另外,它也具有非常有用的ultimate directory (主要目錄)。
  7.profusion (http://profusion.ittc.ukans.edu/)
  由於具有智能化的搜索策略,profusion提供了最好的集成搜索的環境。對於你的查詢要求,可以選擇三個最好的搜索引擎、或三個最快的搜索引擎、或全部搜索引擎、或手工選擇任意幾個搜索引擎來進行搜索。它最具個性化的功能是:經過一次免費註册後,它會對你的查詢要求每周或每月返回一個集成網頁並用電子郵件通知你某些網頁更新了。
  8. mamma (http://www.mamma.com/)
  mamma分析你的查詢要求並適當格式化,以便提交到每個搜索引擎或數據庫進行搜索。按照你的查詢要求,它可以同步搜索多達7個搜索引擎。然後,它將返回的結果組織成一種格式。其缺點是:對返回結果的集成功能非常簡陋,欠缺高級選項。
  9.ask jeeves (http://www.askjeeves.com/)
  ask jeeves的特點是搜索速度相當快,很有創造性,但返回結果並不很精確。它對你的查詢要求不作格式化,任其自然,然後將之提交到它自己的數據庫和alta vista、excite、infoseek、lycos、webcrawler等搜索引擎中進行搜索。
  10. highway 61 (http://www.highway61.com/)
  對於簡單的查詢要求,利用highway 61,可望獲得快速可信的結果。但返回的結果質量不高
  11.dogpile (http://www.dogpile.com/)
  它不僅可搜索web界面,還可以搜索usenet、ftp站點和新聞綫索,這是它的一大特點。它具有智能化的搜索程序和易用界面,但缺少其同類metacrawler所具有的對返回結果的集成功能。
  除以上所說的集成搜索引擎外,網友們還可以到all-in-one (http://www.albany.net/allinone/)、searches (http://www.searches.com/)、search (http://www.search.com/)去逛逛,它們各具一些特色,但看來不會比上面提到的更出色了。據筆者的使用體會,建議網友多用savvysearch和profusion搜索,它們會帶給你很爽的感覺。