《大规模元搜索引擎技(1)》一1.4 本书概述

简介:

本节书摘来自华章出版社《大规模元搜索引擎技(1)》一书中的第1章,第1.4节,作者[美]孟卫一(Weiyi Meng)纽约州立大学宾汉姆顿分校於德(Clement T.Yu)伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.4 本书概述

本书的其余部分将专注于大规模元搜索引擎技术。现在简述其余各章。
第2章首先概述一个典型的大规模元搜索引擎的主要部件。这些部件包括搜索引擎选择器、搜索引擎加入器和结果合并器。通过对元搜索引擎和主流搜索引擎两种搜索技术优点和缺点的仔细分析,这一章试图提出充分理由来阐述元搜索引擎技术可以作为主流搜索引擎之外的另一种可行搜索技术。最后,鉴于元搜索引擎构建于Web环境,这一章将对Web环境进行讨论,进而对构建大规模元搜索引擎所面临的挑战给出一些见解。
第3章集中讨论搜索引擎选择器。对任何给定的用户查询,这个部件的目标是在元搜索引擎使用的那些搜索引擎中,确定哪个搜索引擎最有可能返回有用的结果。这一章将解决三个重要的问题:如何代表每个搜索引擎的内容;如何使用代表信息选择搜索引擎;如何生成代表信息。这一章将介绍几种类型的方法但重点讨论使用搜索词的详细统计数据来代表搜索引擎内容的方法。
第4章讨论把搜索引擎加入元搜索引擎所需的技术。将涉及两个主要问题。第一是关于元搜索引擎与其每个成员搜索引擎之间建立通信的问题。基本上,一个元搜索引擎需要把用户查询传给每个成员搜索引擎,根据每个成员搜索引擎格式要求进行必要的查询格式改变,并接收每个成员搜索引擎返回的响应页面。第二个问题是关于从响应页面提取搜索结果记录,每个记录对应于一个检索页面。这一章将介绍几种结果提取技术。
第5章介绍各种搜索结果合并算法。这些算法沿着几个维度涵盖广泛的场景。第一个维度是有关使用每个结果的何种类型信息进行合并,信息种类可从每个结果的本地排序,到每个结果的标题和概览,到每个结果的完整文档。一些合并算法同时使用多种类型的信息。第二个维度是各成员搜索引擎返回查询的文档之间的重叠度,范围可从没有重叠到有一些重叠,到完全相同的文档集。
第6章总结本书主要论述的内容,讨论元搜索引擎技术未来的发展方向,列出一些具有挑战性的有待研究的具体问题。

相关文章
|
机器学习/深度学习 人工智能 算法
阿里公开自研AI集群细节:64个GPU,百万分类训练速度提升4倍
从节点架构到网络架构,再到通信算法,阿里巴巴把自研的高性能AI集群技术细节写成了论文,并对外公布。
阿里公开自研AI集群细节:64个GPU,百万分类训练速度提升4倍
|
7月前
|
人工智能 自然语言处理 Swift
元象开源70 亿参数通用大模型 XVERSE-7B,全开源、免费可商用,魔搭最佳实践来啦!
元象推出 70 亿参数通用大模型 XVERSE-7B 底座与对话版,保持高性能、全开源、免费可商用,让海量中小企业和 AI 开发者能以低成本用上高性能大模型,并在魔搭社区开源,共同推动中国大模型生态建设。
|
存储 SQL 分布式计算
首次公开!阿里云开源PolarDB总体架构和企业级特性
在3月2日的阿里云开源 PolarDB 企业级架构发布会上,阿里云 PolarDB 内核技术专家北侠带来了主题为《PolarDB 总体架构设计和企业级特性》的精彩演讲。
30656 1
首次公开!阿里云开源PolarDB总体架构和企业级特性
|
边缘计算 搜索推荐 大数据
【云周刊】 第210期:阿里巴巴复杂搜索系统的可靠性优化之路
本期头条 欢迎关注云周刊 阿里巴巴复杂搜索系统的可靠性优化之路 搜索引擎是电商平台成交链路的核心环节,搜索引擎的高可用直接影响成交效率。闲鱼搜索引擎作为闲鱼关键系统,复杂度和系统体量都非常高,再加上闲鱼所有导购场景都依靠搜索赋能,搜索服务的稳定可靠成为了闲鱼大部分业务场景可用能力的衡量标准;如何保障搜索服务的稳定和高可用成为了极大的挑战。
4025 0
|
存储 搜索推荐 大数据
《大规模元搜索引擎技》——1.2 文本检索概述
本节书摘来自华章出版社《大数据管理丛书》一书中的第1章,第1.2节,作者 [美]孟卫一(Weiyi Meng), 纽约州立大学, 宾汉姆顿分校於德(Clement T.Yu),伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1683 0
|
搜索推荐 算法 大数据
《大规模元搜索引擎技》——1.4 本书概述
本节书摘来自华章出版社《大数据管理丛书》一书中的第1章,第1.4节,作者 [美]孟卫一(Weiyi Meng), 纽约州立大学, 宾汉姆顿分校於德(Clement T.Yu),伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1144 0
|
Web App开发 数据采集 搜索推荐
《大规模元搜索引擎技》——1.3 搜索引擎技术概述
本节书摘来自华章出版社《大数据管理丛书》一书中的第1章,第1.3节,作者 [美]孟卫一(Weiyi Meng), 纽约州立大学, 宾汉姆顿分校於德(Clement T.Yu),伊利诺伊大学芝加哥分校,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1176 0