《大规模元搜索引擎技(1)》一第2章 元搜索引擎体系结构-阿里云开发者社区

开发者社区> 华章出版社> 正文
登录阅读全文

《大规模元搜索引擎技(1)》一第2章 元搜索引擎体系结构

简介:

本节书摘来自华章出版社《大规模元搜索引擎技(1)》一书中的第2章,作者[美]孟卫一(Weiyi Meng)纽约州立大学宾汉姆顿分校於德(Clement T.Yu)伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看

第2章 元搜索引擎体系结构

元搜索引擎是一个提供统一方式访问多个现有搜索引擎的搜索系统。该系统基于元搜索(metasearch)概念,元搜索是实时在线搜索多数据源的模式。元搜索与联合搜索(federated search)的含义非常相似,这两个术语有时可以互换。元搜索引擎有时也称为搜索代理(search broker),因为它在搜索信息的用户和一组搜索引擎之间充当“中间人”的角色[Craswell,N.,2000]。元搜索引擎与分布式信息检索(distributed information retrieval)[Craswell,N.,2000]和联合搜索系统(federated search system)[Shokouhi and Si,2011]密切相关,尽管它们之间存在一些差异,这些将在2.1节中讨论。
Web元搜索概念从20世纪90年代初就出现了。最早的元搜索引擎之一(如果不是最早的话)MetaCrawler(http://www.metacrawler.com/)首次开发于1994年。此后,大量的元搜索引擎被开发出来并用于Web。本章及随后的章节将提到其中一些元搜索引擎。
本章对元搜索引擎技术进行一般性讨论。2.1节介绍可供参考的元搜索引擎体系结构。该结构包含所有主要的系统部件,并且描述每个部件的功能。2.2节比较元搜索引擎技术与搜索引擎技术,并深入分析其优缺点。其目的是提供一个令人信服的论点,即元搜索引擎技术,特别是大规模元搜索引擎技术,具有搜索引擎不具备的优越和独特的功能,使其能够在越来越重要的Web搜索领域扮演重要的角色。2.3节对元搜索引擎构建和操作的Web环境进行仔细分析,目的是弄清楚构建元搜索引擎特别是大规模元搜索引擎将会遇到的困难和挑战。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: