技術 > 元搜索
目錄
No. 1
  元搜索工作原理及起源綜介 元搜索引擎又稱多搜索引擎,它可以同時查找多個單搜索引擎的www站點.按其搜索機製可分為並列式和串行式.並行式元搜索引擎指將查詢要求同時發嚮各個獨立的搜索引擎,然後將結果按特定的順序提供給用戶。串行式元搜索引擎是將查詢要求先發給某個獨立的搜索引擎,待其返回結果再將請求發給另一個搜索引擎,並行式元搜索引擎運行模式好,搜索時間短。
  世界上最早的元搜索是metacrawler,它是infospace inc.的一部分,初始網上運行時間為 1995年,是由華盛頓大學的學生erik和教授oren etzin共同開發研製的。它是萬維網搜索引擎metacrawler的姐妹引擎,是一個並行式的元搜索引擎。具有同時調用google、yahoo、ask jeeves about、looksmart、teoma overture、findwhat等搜索引擎的功能,然後按相關度給出精確,詳細的結果。輸入網址http://www.metacrawler.com進入主頁面。
  它可以對網頁、圖像、音頻、多媒體、新聞、購物等進行選擇檢索,還提供了如下高級檢索功能:
  提高你檢索的品質(qualify your search):你可以創建一個特定的檢索,查詢一個精確的字段,或者排除包含特定詞的頁面。
  使用布爾邏輯符檢索(use boolean terms):在關鍵詞中使用and,or和not布爾邏輯檢索符,使得檢索結果更精確。
  最後更新頁面(last page update):使用after來查詢特定日期後更新的結果,使用before來查詢在特定日期千更新的結果。同時選擇after和before,將檢索出兩個日期之間的結果。
  域名過濾(domain filter):可以排除以.com、.gov、.edu結尾的域名,你也可以包括一個特殊的包含.com的域名。
  成人過濾(adult filter):可以包含或者過濾掉web檢索結果中的成人內容。
  語言選擇(language _select_ion):可以選擇返回結果所用的語言。
  結果展示(results display):可以選擇檢索結果排序的方式,按與檢索詞的相關性排序或者按搜索引擎展示結果的順序排序。
  搜索引擎功能和性能的術語 簡單搜索(simple search)指輸入一個單詞(關鍵詞),提交搜索引擎查詢,這是最基本的搜索方式。
  詞組搜索(phrase search)指輸入兩個單詞以上的詞組(短語),提交搜索引擎查詢,也叫短語搜索。現有的搜索引擎一般都約定把詞組或短語放在引號“”內表示。
  語句搜索(sentence search)指輸入一個多詞的任意語句,提交搜索引擎查詢,這種方式也叫任意查詢。不同搜索引擎對語句中詞與詞之間的關係的處理方式不同。
  目錄搜索(catalog search)指按搜索引擎提供的分類目錄逐級查詢,用戶一般不需要輸入查詢詞,而是按照查詢係統所給的幾種分類項目,選擇類別進行搜索,也叫分類搜索(classified search)。
  高級搜索(advance search)指用布爾邏輯組配方式查詢,也叫定製搜索。常用的邏輯運算為and(和)、 or(或)和not(非)。
  上述前3種搜索方式可以合稱為詞語搜索(word search),與高級搜索和目錄搜索一起構成3類常見搜索方式。
  在所有搜索方式中,還可使用通配符,就像dos文件係統用“*”作為通配符一樣,通配符用於指代一個串字符,不過,每個搜索引擎所用的通配符不完全相同,大多用“*”或“?”,少數用“$”。
  不少搜索引擎還支持加(+)、減(-)詞操作。 元搜索引擎(meta-search engine) 其英文原意是搜索引擎之後或之上的搜索引擎,即可以同時查詢多個搜索引擎的www站點。雖然元搜索引擎依賴其他獨立搜索引擎而存在,但它們集成了不同性能和不同獨立的搜索引擎並發展了一些新的查詢功能,查一個元搜索引擎就相當於查多個獨立搜索引擎,可以收到事半功倍的效果,故值得選用。
  元搜索引擎及其網站 元搜索引擎在接受用戶查詢請求時,同時在其他多個引擎上進行搜索,並將結果返回給用戶。著名的國外元搜索引擎有infospace、dogpile、vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有比比貓搜索引擎、搜星搜索引擎。在搜索結果排列方面,有的直接按來源引擎排列搜索結果,如dogpile,有的則按自定的規則將結果重新排列組合,如vivisimo。
  國外對元搜索的開發應用很早,目前在美國使用元搜索引擎和使用google一樣普遍,當然google仍然占據美國絶對市場,但元搜索引擎也一樣生機勃勃,財源滾滾。相比國內,起步很晚,中國首傢元搜索引擎是比比貓(www.bbmao.com),於2005年成立,在2006年獲得red herring 亞洲100強奬,從而拉開國內對元搜索的真正關註和探索。整體來講,國外元搜索引擎已自成體係,而國內真正長期堅持致力於開發獨特用戶體驗的元搜索網站並不多。
  元搜索引擎列表
  國內:
  比比貓(bbmao)
  http://www.bbmao.com
  獨創國際領先的聚類和去重技術。搜索結果匯集各大搜索引擎結果,搜索結果智能分類整理,去掉重複搜索結果,並擁有直接搜尋文檔和強大網絡收藏夾等多元功能。對於記者、教授、高管等知性、高端且惜時如金的人群比較適用,支持中英文搜索。
  北斗搜索
  http://www.bydou.com/
  結果來自百度、搜狗、雅虎;左側有深入搜索、相關搜索;可以評價結果。
  xooda 元搜索引擎
  http://www.xooda.com
  支持本地搜索,一次輸入,返回多個搜索引擎結果,並對結果進行重新的優化排序。
  國外:
  vivisimo:是美國vivisimo公司最新開發的一個具有對搜索結果自動進行分類功能的搜索引擎!它能非常快速地將不同類型的網站進行分類整理並將結果呈現在你眼前!它在搜索結果頁面左側增加了一個搜索結果目錄欄。不足之處在於搜索結果精準度不是很高。
  profusionprofusion:是並行式元搜索引擎,擁有智能化的搜索技術、對查詢的實用提示和非常寶貴的個人化搜索服務,它是目前很優秀的元搜索引擎,可同時調用9個獨立萬維網搜索引擎—altavista、excite、hotbot、infoseek、lycos、magellan、opentext、webcrawler和yahoo。
  metacrawlermetacrawler:是獨立萬維網搜索引擎webcrawler的姐妹引擎,也是一個並行式元搜索引擎,它條理清晰,組織結構完美,可以同時調用altavista、excite、infoseek、lycos、webcrawler和yahoo 6個獨立引擎,是簡單搜索或中度復雜搜索的最佳網點。
  dogpiledogpile:是目前性能較好的並行式元搜索引擎之一,它可以同時調用web搜索引擎、usenet搜索引擎和ftp搜索引擎等25個搜索引擎,其中,web搜索引擎14個。
  digisearchdigisearch:是目前能同時調用獨立搜索引擎較多的並行式元搜索引擎,它可以同時調用altavista、 excite、 infoseek、 lycos、 webcrawler、 yahoo、 opentext和 magellen等 18個獨立萬維網搜索引擎,dejanews等3個usenet搜索引擎和fourll等3個個人信息和商界信息搜索引擎。
  highway61highway61:是並行式元搜索引擎,可以同時調用altavista、excite、 infoseek、 lycos、webcrawler和yahoo等6個獨立引擎,並將它們傳回的結果進行排序,顯示給用戶。
  mammamamma:是並行式元搜索引擎,它自稱是所有搜索引擎之母(mother of all search engines),它可以同時調用altavista、excite、infoseek、lycos、webcrawler和yahoo等獨立引擎,並且可以查新聞組、商業黃負和發佈新聞。
什麽是元搜索
  元搜索引擎又稱多搜索引擎,通過一個統一的用戶界面幫助用戶在多個搜索引擎中選擇和利用合適的(甚至是同時利用若幹個)搜索引擎來實現檢索操作,是對分佈於網絡的多種檢索工具的全局控製機製。(搜索引擎分類:全文搜索引擎、目錄索引、元搜索引擎)
  一個真正的元搜索引擎由三部分組成,即:檢索請求提交機製、檢索接口代理機製、檢索結果顯示機製。"請求提交"負責實現用戶"個性化"的檢索設置要求,包括調用哪些搜索引擎、檢索時間限製、結果數量限製等。"接口代理"負責將用戶的檢索請求"翻譯"成滿足不同搜索引擎"本地化"要求的格式。"結果顯示"負責所有源搜索引擎檢索結果的去重、合併、輸出處理等元搜索引擎的出現,對於那些需要連續地使用不同的搜索引擎重複相同的檢索的人來說,是一個福音。使用元搜索引擎同時對幾個搜索引擎進行檢索,獲得分級編排的檢索結果。
  元搜索引擎的另外一個定義:元搜索引擎(Metasearch Engine),是一種調用其它獨立搜索引擎的引擎,亦稱“搜索引擎之母(The mother of searce engines)”。在這裏,“元”(Meta)為“總的”、“超越”之意,元搜索引擎就是對多個獨立搜索引擎的整合、調用、控製和優化利用。相對元搜索引擎,可被利用的獨立搜索引擎稱為“源搜索引擎”(source Engine),或“搜索資源”(searcing resources),整合、調用、控製和優化利用源搜索引擎的技術,稱為“元搜索技術”(Meta-searching technique),元搜索技術是元搜索引擎的核心。
元搜索的起源
  世界上最早的元搜索是metacrawler,它是infospace inc.的一部分,初始網上運行時間為 1995年,是由華盛頓大學的學生erik和教授oren etzin共同開發研製的。它是萬維網搜索引擎metacrawler的姐妹引擎,是一個並行式的元搜索引擎。具有同時調用Google、Yahoo、Ask Jeeves About、LookSmart、Teoma Overture、FindWhat等搜索引擎的功能,然後按相關度給出精確,詳細的結果。它可以對網頁、圖像、音頻、多媒體、新聞、購物等進行選擇檢索,還提供了如下高級檢索功能:
  提高你檢索的品質(Qualify Your Search):你可以創建一個特定的檢索,查詢一個精確的字段,或者排除包含特定詞的頁面。
  使用布爾邏輯符檢索(Use Boolean Terms):在關鍵詞中使用and,or和not布爾邏輯檢索符,使得檢索結果更精確。
  最後更新頁面(Last Page Update):使用After來查詢特定日期後更新的結果,使用Before來查詢在特定日期千更新的結果。同時選擇After和Before,將檢索出兩個日期之間的結果。
  域名過濾(Domain Filter):可以排除以.com、.gov、.edu結尾的域名,你也可以包括一個特殊的包含.com的域名。
  成人過濾(Adult Filter):可以包含或者過濾掉Web檢索結果中的成人內容。
  語言選擇(Language Selection):可以選擇返回結果所用的語言。
  結果展示(Results Display):可以選擇檢索結果排序的方式,按與檢索詞的相關性排序或者按搜索引擎展示結果的順序排序。
元搜索引擎的原理
  元搜索引擎的工作原理我們可將元搜索引擎看成具有雙層客戶機/服務器結構的係統。用戶嚮元搜索引擎發出檢索請求,元搜索引擎再根據該請求嚮多個搜索引擎發出實際檢索請求,搜索引擎執行元搜索引擎檢索請求後將檢索結果以應答形式傳送給元搜索引擎,元搜索引擎將從多個搜索引擎獲得的檢索結果經過整理再以應答形式傳送給實際用戶。當然,某些元搜索引擎具有略微不同的機製。
搜索引擎功能和性能的術語
  簡單搜索(Simple Search)指輸入一個單詞(關鍵詞),提交搜索引擎查詢,這是最基本的搜索方式。
  詞組搜索(Phrase Search)指輸入兩個單詞以上的詞組(短語),提交搜索引擎查詢,也叫短語搜索。現有的搜索引擎一般都約定把詞組或短語放在引號“”內表示。
  語句搜索(Sentence Search)指輸入一個多詞的任意語句,提交搜索引擎查詢,這種方式也叫任意查詢。不同搜索引擎對語句中詞與詞之間的關係的處理方式不同。
  目錄搜索(Catalog Search)指按搜索引擎提供的分類目錄逐級查詢,用戶一般不需要輸入查詢詞,而是按照查詢係統所給的幾種分類項目,選擇類別進行搜索,也叫分類搜索(Classified SearCh)。
  高級搜索(Advance Search)指用布爾邏輯組配方式查詢,也叫定製搜索。常用的邏輯運算為AND(和)、 OR(或)和NOT(非)。
  上述前3種搜索方式可以合稱為詞語搜索(Word Search),與高級搜索和目錄搜索一起構成3類常見搜索方式。
  在所有搜索方式中,還可使用通配符,就像DOS文件係統用“*”作為通配符一樣,通配符用於指代一個串字符,不過,每個搜索引擎所用的通配符不完全相同,大多用“*”或“?”,少數用“$”。
  不少搜索引擎還支持加(+)、減(-)詞操作。 元搜索引擎(Meta-search engine) 其英文原意是搜索引擎之後或之上的搜索引擎,即可以同時查詢多個搜索引擎的WWW站點。雖然元搜索引擎依賴其他獨立搜索引擎而存在,但它們集成了不同性能和不同獨立的搜索引擎並發展了一些新的查詢功能,查一個元搜索引擎就相當於查多個獨立搜索引擎,可以收到事半功倍的效果,故值得選用。
元搜索引擎的發展方向及前景
  元搜索引擎是為彌補傳統搜索引擎的不足而出現的一種輔助檢索工具,有着傳統搜索引擎所不具備的許多優勢。但是,元搜索引擎依賴於數據庫選擇技術、文本選擇技術、查詢分派技術和結果綜合技術等。用戶界面的改進、調用策略的完善、返回信息的整合以及最終檢索結果的排序,仍然是未來元搜索引擎研究的重點。
元搜索引擎及其網站
  元搜索引擎在接受用戶查詢請求時,同時在其他多個引擎上進行搜索,並將結果返回給用戶。著名的國外元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有比比貓搜索引擎、搜星搜索引擎。在搜索結果排列方面,有的直接按來源引擎排列搜索結果,如Dogpile,有的則按自定的規則將結果重新排列組合,如Vivisimo。
  國外對元搜索的開發應用很早,目前在美國使用元搜索引擎和使用Google一樣普遍,當然Google仍然占據美國絶對市場,但元搜索引擎也一樣生機勃勃,財源滾滾。相比國內,起步很晚,中國首傢元搜索引擎是比比貓(bbmao),於2005年成立,在2006年獲得Red Herring 亞洲100強奬,從而拉開國內對元搜索的真正關註和探索。近期比較優秀的元搜索引擎有搜魅網(someta),整合了百度、𠔌歌、雅虎等多傢主流搜索引擎的結果,並且獨創網站查詢。
  整體來講,國外元搜索引擎已自成體係,而國內真正長期堅持致力於開發獨特用戶體驗的元搜索網站並不多。
主要元搜索引擎列表
  國內:
  ·搜魅網(someta)
  集合了百度、google、搜狗、雅虎多傢主流搜索引擎的結果,提供網頁、資訊、網址導航等聚合查詢。另外,搜魅網突破了元搜索引擎沒有自己的蜘蛛的瓶頸,提供了網站查詢的功能。
  ·比比貓(Bbmao)
  獨創國際領先的聚類和去重技術。搜索結果匯集各大搜索引擎結果,搜索結果智能分類整理,去掉重複搜索結果,並擁有直接搜尋文檔和強大網絡收藏夾等多元功能。對於記者、教授、高管等知性、高端且惜時如金的人群比較適用,支持中英文搜索。
  ·全博元搜索(QOOPOO)
  聚合搜索的力量,已經運行多年,2006年格林斯潘曾接觸這傢公司,後勁比較強勁。
  ·Xooda 元搜索引擎
  支持本地搜索,一次輸入,返回多個搜索引擎結果,並對結果進行重新的優化排序。
  ·佐意綜合搜索(Chinazss)
  集主流搜索引擎為一體,分類詳細,強大的搜索功能。讓搜索變得更方便!
  國外:
  Vivisimo:是美國Vivisimo公司最新開發的一個具有對搜索結果自動進行分類功能的搜索引擎!它能非常快速地將不同類型的網站進行分類整理並將結果呈現在你眼前! 它在搜索結果頁面左側增加了一個搜索結果目錄欄。不足之處在於搜索結果精準度不是很高。
  ProFusionProFusion:是並行式元搜索引擎,擁有智能化的搜索技術、對查詢的實用提示和非常寶貴的個人化搜索服務,它是目前很優秀的元搜索引擎,可同時調用9個獨立萬維網搜索引擎—AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、Webcrawler和Yahoo。
  MetaCrawlerMetaCrawler:是獨立萬維網搜索引擎WebCrawler的姐妹引擎,也是一個並行式元搜索引擎,它條理清晰,組織結構完美,可以同時調用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6個獨立引擎,是簡單搜索或中度復雜搜索的最佳網點。
  DogpileDogPile:是目前性能較好的並行式元搜索引擎之一,它可以同時調用Web搜索引擎、Usenet搜索引擎和FTP搜索引擎等25個搜索引擎,其中,Web搜索引擎14個。
  DigisearchDigisearch:是目前能同時調用獨立搜索引擎較多的並行式元搜索引擎,它可以同時調用AltaVista、 Excite、 Infoseek、 Lycos、 WebCrawler、 Yahoo、 OpenText和 Magellen等 18個獨立萬維網搜索引擎,DejaNews等3個Usenet搜索引擎和Fourll等3個個人信息和商界信息搜索引擎。
  Highway61Highway61:是並行式元搜索引擎,可以同時調用AltaVista、Excite、 Infoseek、 Lycos、WebCrawler和Yahoo等6個獨立引擎,並將它們傳回的結果進行排序,顯示給用戶。
  MammaMamma:是並行式元搜索引擎,它自稱是所有搜索引擎之母(Mother of all Search Engines),它可以同時調用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo等獨立引擎,並且可以查新聞組、商業黃負和發佈新聞。
相關詞
中文元搜索引擎搜索引擎萬維元搜索公司
包含詞
元搜索引擎多元搜索網元搜索公司
多元搜索引擎多元搜索工具客戶元搜索程序
中文元搜索引擎