《大规模元搜索引擎技(1)》一第2章 元搜索引擎体系结构

简介:

本节书摘来自华章出版社《大规模元搜索引擎技(1)》一书中的第2章,作者[美]孟卫一(Weiyi Meng)纽约州立大学宾汉姆顿分校於德(Clement T.Yu)伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看

第2章 元搜索引擎体系结构

元搜索引擎是一个提供统一方式访问多个现有搜索引擎的搜索系统。该系统基于元搜索(metasearch)概念,元搜索是实时在线搜索多数据源的模式。元搜索与联合搜索(federated search)的含义非常相似,这两个术语有时可以互换。元搜索引擎有时也称为搜索代理(search broker),因为它在搜索信息的用户和一组搜索引擎之间充当“中间人”的角色[Craswell,N.,2000]。元搜索引擎与分布式信息检索(distributed information retrieval)[Craswell,N.,2000]和联合搜索系统(federated search system)[Shokouhi and Si,2011]密切相关,尽管它们之间存在一些差异,这些将在2.1节中讨论。
Web元搜索概念从20世纪90年代初就出现了。最早的元搜索引擎之一(如果不是最早的话)MetaCrawler(http://www.metacrawler.com/)首次开发于1994年。此后,大量的元搜索引擎被开发出来并用于Web。本章及随后的章节将提到其中一些元搜索引擎。
本章对元搜索引擎技术进行一般性讨论。2.1节介绍可供参考的元搜索引擎体系结构。该结构包含所有主要的系统部件,并且描述每个部件的功能。2.2节比较元搜索引擎技术与搜索引擎技术,并深入分析其优缺点。其目的是提供一个令人信服的论点,即元搜索引擎技术,特别是大规模元搜索引擎技术,具有搜索引擎不具备的优越和独特的功能,使其能够在越来越重要的Web搜索领域扮演重要的角色。2.3节对元搜索引擎构建和操作的Web环境进行仔细分析,目的是弄清楚构建元搜索引擎特别是大规模元搜索引擎将会遇到的困难和挑战。

相关文章
|
2月前
|
自然语言处理 搜索推荐 Java
号称elastic seaech 100多倍性能的Manticore search搜索引擎有多强
号称elastic seaech 100多倍性能的Manticore search搜索引擎有多强
78 0
|
6月前
|
存储 人工智能 数据可视化
元象开源650亿参数高性能大模型,无条件免费商用!魔搭最佳实践来了!
为推动国产大模型开源生态繁荣与产业应用快速发展,元象XVERSE公司宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用,业界尚属首次。
|
Web App开发 数据采集 自然语言处理
成本不到100美元!UC伯克利再开源类ChatGPT模型「考拉」:数据量大没有用,高质量才是王道
成本不到100美元!UC伯克利再开源类ChatGPT模型「考拉」:数据量大没有用,高质量才是王道
118 0
|
Cloud Native Java Go
10+知识图谱开放下载,让你的学习效率提升5倍! | “右脑”开发套餐
为了让广大开发者清晰了解技术体系,打造属于自己的系统学习路径。今天,开发者社区整理了10+知识图谱,供大家交流学习,持续更新中~
30790 0
10+知识图谱开放下载,让你的学习效率提升5倍! |  “右脑”开发套餐
|
搜索推荐 大数据
《大规模元搜索引擎技》——2.1 系统体系结构
本节书摘来自华章出版社《大数据管理丛书》一书中的第2章,第2.1节,作者 [美]孟卫一(Weiyi Meng), 纽约州立大学, 宾汉姆顿分校於德(Clement T.Yu),伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1560 0
|
搜索推荐 大数据
《大规模元搜索引擎技(1)》一导读
当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活的方方面面,原有的数据管理理论体系与大数据产业应用之间的差距日益加大,而工业界对于大数据人才的需求却急剧增加。大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任。
927 0