【电商搜索】现代工业级电商搜索技术-Ha3搜索引擎平台简介

简介: 【电商搜索】现代工业级电商搜索技术-Ha3搜索引擎平台简介

【电商搜索】现代工业级电商搜索技术-Ha3搜索引擎平台简介

— 初稿V1.0

Ha3搜索引擎平台详细介绍

在当今的互联网时代,搜索引擎扮演着至关重要的角色,尤其是在电子商务领域。Ha3搜索引擎平台是由阿里巴巴搜索团队开发的一个先进的搜索引擎,它为阿里巴巴集团的核心业务如淘宝、天猫等提供搜索服务支持。本文将详细介绍Ha3的架构、在线和离线流程、业务逻辑、运维机制等方面的内容。

Ha3搜索引擎概述

Ha3是一个高性能的搜索引擎平台,旨在为用户提供快速、准确的搜索结果。它通过高效的索引构建、智能的查询处理和灵活的业务配置,满足了阿里巴巴集团内部多样化的搜索需求。

Ha3的架构

Ha3是阿里巴巴搜索团队开发的搜索引擎平台,它为阿里集团包括淘宝、天猫在内的核心业务提供搜索服务支持。Ha3的架构设计包括在线和离线两部分,以及与之相关的多个组件和服务。

在线架构

在线部分负责处理用户的搜索请求,并返回搜索结果。它主要包括以下两个角色:

  1. Qrs(Query Result Searcher):Qrs是用户查询的入口,它接收用户的查询请求,并将请求分发给Searcher,收集并整合Searcher返回的结果,最终将结果返回给用户。
  2. Searcher:Searcher是搜索查询的执行者,负责索引的召回、过滤、统计、打分、排序和摘要生成等工作。

离线架构

离线部分负责索引数据的生成。Ha3的索引数据是通过搜索团队开发的Build Service系统生成的。

  1. Build Service:Build Service是一个独立的服务,负责监控数据源,生成全量和增量索引,并分发到Ha3的Searcher。

业务概念

Ha3从业务角度定义了zone、biz、table等概念:

  • Table:数据表,一个zone必须包含一张主表,也可以包含辅表,辅表数据是对主表的补充。
  • Zone:用于将多个biz与多个table进行业务划分。
  • Biz:业务配置,描述了Qrs和Searcher上的统计、算分、排序、摘要等环节。

业务查询流程

Ha3的业务查询流程包括以下步骤:

  1. 搜索入口:用户通过搜索入口访问Ha3,生成查询请求。
  2. Qrs处理:Qrs接收请求,并将请求分发给Searcher。
  3. Searcher执行:Searcher执行索引查找、过滤、统计等操作。
  4. 结果整合:Qrs收集并整合Searcher返回的结果,返回给用户。

运维机制

Ha3的运维机制包括版本更新、配置更新、索引更新、扩行扩列、机器调度分配等操作,通过web操作和后端子模块相互配合完成。

运维子模块

  1. Suez Ops:线上运维操作的入口,提供配置更新、回滚、扩行扩列、资源调整等功能。
  2. Suez Admin:管理Qrs和Searcher worker,执行具体的变更行为。
  3. Carbon:调度框架,负责收集worker状态并调度具体的worker执行任务。

插件机制

Ha3提供了插件机制,允许用户开发自己的插件,以实现业务的可定制化。

总结

Ha3搜索引擎平台是阿里巴巴集团内部一个强大的搜索工具,它通过高效的架构设计、灵活的业务配置和稳定的运维机制,为用户提供了快速、准确的搜索体验。随着技术的不断进步和业务需求的不断变化,Ha3将继续优化和发展,以满足更多用户的需求。


相关文章
|
SQL 运维 搜索推荐
《揭秘,阿里开源自研搜索引擎Havenask的在线检索服务》
Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎,深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了Havenask的在线检索服务,它具备高可用、高时效、低成本的优势,帮助企业和开发者量身定做适合业务发展的智能搜索服务。
85262 138
|
人工智能 搜索推荐 异构计算
|
存储 消息中间件 搜索推荐
【前沿技术】 阿里开源搜索引擎Havenask的消息系统
Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎,深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了Havenask的消息系统--Swift,它是一个设计用于处理大规模的数据流和实时消息传递的高性能、可靠的消息系统。
61447 3
|
机器学习/深度学习 算法 流计算
深度预测平台RTP介绍
前言 RTP平台是阿里内部一个通用的在线预测平台,不仅支持淘系搜索、推荐、聚划算、淘金币等业务,也支持国际化相关icbu、lazada等搜索推荐业务,同时还支持着淘客,优酷、飞猪等大文娱的搜索推荐场景。
10878 0
|
存储 消息中间件 安全
计算与存储分离实践—swift消息系统
swift是搜索事业部自主研发分布式消息系统,它的主要存储基于分布式文件系统,资源需求基于分布式调度系统。swift能支持每秒数亿的消息传递,支持PB级消息的存储。
7141 0
|
11月前
|
人工智能 自然语言处理 算法
阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级
本文介绍了阿里云 AI 搜索开放平台的技术的特点及其在各行业的应用。
1127 3
|
8月前
|
存储 消息中间件 搜索推荐
京东零售基于Flink的推荐系统智能数据体系
摘要:本文整理自京东零售技术专家张颖老师,在 Flink Forward Asia 2024 生产实践(二)专场中的分享,介绍了基于Flink构建的推荐系统数据,以及Flink智能体系带来的智能服务功能。内容分为以下六个部分: 推荐系统架构 索引 样本 特征 可解释 指标 Tips:关注「公众号」回复 FFA 2024 查看会后资料~
519 1
京东零售基于Flink的推荐系统智能数据体系
|
运维 搜索推荐 调度
Ha3搜索引擎简介
Ha3是阿里巴巴搜索团队开发的搜索引擎平台,它为阿里集团包括淘宝、天猫在内的核心业务提供搜索服务支持。
26176 1
|
搜索推荐 大数据 数据库
【Havenask实践篇】搭建文本检索服务
Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎,深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文举例数据库检索加速的一个简单场景,使用Havenask对数据库的文本字段建立倒排索引,通过倒排检索列提高检索性能,缩短检索耗时。
114769 51
【Havenask实践篇】搭建文本检索服务