Hologres向量检索和全文检索在淘天客户运营的实践

简介: 淘天集团客户运营团队基于Hologres构建向量+全文一体化检索方案,融合语义理解与关键词匹配,毫秒级召回海量非结构化文本,已支撑智能客服、规则比对、舆情分析等核心场景,显著提升准确率与响应速度。

在淘天集团(淘宝天猫)客户运营团队的数据实践中,随着AI应用的深入落地,如何高效、准确地从海量非结构化文本中召回相关知识,成为支撑智能客服、规则比对、舆情分析等关键业务场景的核心技术挑战。面对这一需求,淘天客户运营团队基于Hologres构建了一套融合向量检索与全文检索的一体化解决方案,并已在多个业务场景中取得显著成效。

为何需要向量检索与全文检索?

在大模型时代,本地知识库成为增强模型能力的重要手段。然而,当知识规模达到数十万甚至上百万条时,传统的本地知识管理方式难以维护;而通过SQL中的LIKE或正则表达式进行关键词匹配,不仅规则难以穷举、匹配精度低,且在大规模数据下性能堪忧——查询响应常达数秒,无法满足线上服务的实时性要求。

幻灯片4.PNG

为解决这一问题,团队引入了两种互补的检索范式:全文检索向量检索。全文检索基于关键词匹配,通过对文本内容进行分词并建立倒排索引,实现毫秒级的快速召回。例如,用户输入“我在杭州很想你”,系统可精准匹配包含“杭州”“想你”等关键词的知识条目。然而,关键词本身缺乏语义理解能力——当用户提问“水果有哪些?”,仅靠关键词无法召回“苹果”“香蕉”等具体实例。

此时,向量检索的价值凸显。通过将文本嵌入为高维向量(如128维),系统可基于语义相似度进行召回,实现“水果”与“苹果”之间的语义关联。在实际应用中,团队通常将两种检索方式结合使用:先通过向量检索获取语义相近的结果,再辅以全文检索补充关键词匹配项,最终将融合后的结果送入大模型进行推理与生成,形成完整的RAG(Retrieval-Augmented Generation)流程。

为何选择Hologres?

幻灯片6.PNG

面对上述需求,团队最终选择Hologres作为底层引擎,主要基于三方面考量:

首先,Hologres具备强大的实时数仓与OLAP能力,不仅支持向量与全文检索,还能在同一张表中无缝集成标量过滤、多字段排序、复杂JOIN等分析操作,极大提升了方案的扩展性与灵活性。

其次,自4.0版本起,Hologres推出了自研的HGraph向量索引,替代了早期依赖的达摩院Proxima。在千万级数据量下,HGraph的平均响应时间从Proxima的4秒降至30毫秒,性能提升两个数量级。同时,Hologres还内置了全文检索能力,支持中文分词、AND/OR逻辑匹配、写入即查等特性,真正实现“一张表、一套引擎、两种检索”。

幻灯片7.PNG

最后,稳定性与运维体验是长期落地的关键。淘天客户运营团队自Hologres 1.0版本起便深度使用,见证了其从初期稳定性不足到如今支持多资源组、Serverless计算、热扩容与热升级的演进。近两年,在业务用量持续增长的同时,稳定性问题显著减少,为高可用线上服务提供了坚实保障。

HGraph vs Proxima:性能跃升

幻灯片10.PNG

在向量检索引擎选型中,团队对HGraph与Proxima进行了实测对比。在40万条、128维内积向量的场景下,两者性能差异尚不明显(Proxima约40ms,HGraph约30ms)。但在950万条(近千万级)数据下,Proxima的平均RT飙升至4秒,而HGraph仍稳定在30毫秒左右——仅指纯向量召回阶段,若叠加后续OLAP操作(如过滤、排序),整体延迟通常控制在数百毫秒内,完全满足业务需求。

幻灯片9.PNG

使用HGraph极为简便:只需在建表时声明向量字段维度(如knowledge_vectors array<float>,维度128),并指定索引类型为hgraph及相似度度量方式(如余弦相似度),即可自动构建索引。通过EXPLAIN ANALYZE可验证查询是否命中Vector Filter,确保向量检索路径生效。

全文检索:简单高效,写入即查

Hologres的全文检索同样表现出色。系统采用 jieba分词器 对中文文本进行分词,并构建倒排索引。在小数据量但长文本的场景中,简单查询可实现30余毫秒响应;即便在7亿条数据、复杂AND匹配、带排序的条件下,响应时间也仅约200毫秒,完全满足线上服务SLA。

幻灯片12.PNG

使用流程同样简洁:创建列存表后,对目标文本字段构建全文索引。若索引在写入前创建,则数据写入后自动触发compaction,实现“写入即可查”;若先写入后建索引,则需手动执行compaction(需注意资源水位,避免影响线上服务)。查询时可通过TEXT函数封装关键词,并指定OR(默认)或AND逻辑。同样,通过EXPLAIN ANALYZE观察是否命中Fulltext Filter,可确认索引生效。

相比Elasticsearch等传统全文引擎,Hologres的配置更为直观,无需理解复杂的JSON参数,大幅降低使用门槛。同时,其与OLAP能力的原生集成,使得“检索+分析”一体化成为可能。

整体技术方案

该方案整体分为三个阶段:准备阶段检索阶段应用阶段


幻灯片16-1.png 幻灯片13.PNG

准备阶段,原始文本(如客服知识、平台规则)经过清洗、规则增强(如生成相似问)后,分别通过Embedding模型生成向量,并保留原始文本用于全文索引。随后,向量与文本一同写入Hologres同一张表中,系统自动构建HGraph与全文索引。

检索阶段,用户Query被同时送入Embedding模型与分词器,生成向量与关键词,分别触发向量检索与全文检索。两路结果可加权融合或独立使用,最终召回Top-K相关文档。

应用阶段,召回结果作为上下文输入大模型,结合Prompt工程与工具调用(如规则比对、订单查询),生成最终答案或决策建议,服务于智能客服Agent、规则分析平台等上层应用。

幻灯片14.PNG

场景一:商家求助知识召回

幻灯片18.PNG

在客服场景中,消费者或商家通过小蜜或者商家服务大厅发起咨询,期望在最前端智能侧准确解答,避免转接人工。团队基于Hologres构建了融合向量与全文检索的知识召回系统。

具体流程如下:用户进线后,系统首先对Query进行Embedding生成向量,并进行分词处理。随后,向量检索与全文检索并行执行,分别从知识库中召回语义相近和关键词匹配的解决方案。召回结果(通常为20-40条)被送入大模型应用,结合精心设计的Prompt进行推理与精排,最终生成精准回答。该方案部署在整个客服链路的最前置环节,显著提升了智能解决率。相比早期基于LIKE/正则的方案,新系统不仅响应更快,且能有效处理语义泛化问题(如“退款”可召回“仅退款”“退货退款”等细分场景),大幅优化用户体验。实际运行数据显示,该方案在召回率、点击率与准确率等核心指标上均有显著提升。

幻灯片19.PNG

场景二:商规则全文检索

在平台规则制定中,需定期分析友商的规则变更(如退货赔付标准),以调整自身策略。由于规则文本多为半结构化,格式不一,传统规则匹配难以覆盖。

团队构建了基于Hologres全文检索的规则分析系统:通过爬虫采集规则,清洗后存入Hologres并建立全文索引。用户输入检索意图(如“查看各平台关于7天无理由退货的规定”),系统召回相关条款,再由大模型进行对比总结,最终在前端展示结构化对比结果。

幻灯片23.PNG

该方案将原本秒级甚至超时的正则匹配,优化至500毫秒内返回,且召回率显著提升,解决了大量因关键词变异导致的漏召问题。

幻灯片24.PNG

未来展望

尽管当前方案已取得良好效果,团队仍对Hologres提出进一步期望:

业务层面,计划将该能力拓展至舆情分析相似案例聚类场景。例如,通过图像识别提取用户在社交平台发布的客服聊天截图,再结合向量与全文检索,精准定位原始对话及关联订单,辅助质检与根因分析;或对客服历史对话进行相似案例召回与聚类,提炼共性问题,优化服务策略。

幻灯片26.PNG

能力层面,希望Hologres能进一步简化使用链路:一是支持内置Embedding函数,避免业务方依赖外部模型服务;二是允许全文检索的查询参数为变量(而非仅常量),以支持动态查询场景;三是优化增量compaction机制,使异步compaction也能走Serverless资源组,避免对在线服务造成资源冲击。

综上,Hologres凭借其一体化的向量与全文检索能力、卓越的性能表现及稳定的工程体验,已成为淘天客户运营团队构建智能检索系统的首选引擎。随着更多场景的落地与能力的持续演进,其在AI时代的基础设施价值将进一步凸显。

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
22天前
|
数据采集 供应链 物联网
别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型
别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型
201 3
|
10天前
|
数据采集 JSON API
从踩坑到高效落地:关键词搜索京东商品列表API的实操心得
本指南聚焦京东商品列表API实操,详解jd.item_search接口调用要点:涵盖必填参数(app_key、timestamp、sign等)、关键词/分页/价格筛选配置及核心响应字段(SKU、标题、售价、销量等),助开发者快速对接,高效获取合规商品数据。(239字)
131 22
|
20天前
|
数据采集 人工智能 安全
智医赋能,守正创新——AI发展对医疗事业的冲击与发展思考
人工智能(AI)的快速发展正深刻重塑医疗事业的发展模式,既为医疗行业带来效率提升、精准度优化、资源均衡等积极变革,也引发了伦理规范、技术适配、人才结构等方面的挑战。本文简要剖析AI对医疗事业的正反两方面冲击,探讨如何合理运用AI技术,推动医疗事业高质量发展。
106 37
|
3月前
|
机器学习/深度学习 缓存 物联网
打造社交APP人物动漫化:通义万相wan2.x训练优化指南
本项目基于通义万相AIGC模型,为社交APP打造“真人变身跳舞动漫仙女”特效视频生成功能。通过LoRA微调与全量训练结合,并引入Sage Attention、TeaCache、xDIT并行等优化技术,实现高质量、高效率的动漫风格视频生成,兼顾视觉效果与落地成本,最终优选性价比最高的wan2.1 lora模型用于生产部署。(239字)
1337 103
|
21天前
|
SQL 人工智能 关系型数据库
让慢SQL消失在提交前:Qoder × RDS AI助手Skill的实时拦截术
在AI Coding快节奏开发中,SQL质量常成盲区:测试难复现、人工Review低效、问题滞后暴露。RDS AI助手提供实时SQL智能审查,3分钟集成Qoder,覆盖正确性、性能、索引、可维护性等维度,将“事后救火”变为“事前预防”,让高质量SQL成为开发默认标准。
|
1月前
|
人工智能 网络协议 机器人
2026年OpenClaw(原ClawdBot)部署接入QQ/飞书/钉钉/微信喂饭教程(阿里云专属,零基础保姆级)
2026年,OpenClaw(原ClawdBot,曾用名Moltbot)凭借“自然语言驱动+多任务自动化执行+全渠道适配”的核心优势,成为开源AI智能体赛道的现象级项目,GitHub星标数突破18.6万,吸引了无数个人用户和企业团队投身部署使用。作为一款定位为“真正能干事情的AI”,OpenClaw的核心价值不仅在于自动化办公、代码辅助、网页抓取等基础功能,更在于其强大的多渠道对接能力——可无缝接入QQ、飞书、钉钉、微信(喂饭模式)四大主流通讯工具,让AI助理突破Web控制台的限制,融入日常聊天场景,实现“聊两句就能下达指令、完成任务”。
1659 6
|
17天前
|
机器学习/深度学习 人工智能 文字识别
小红书开源FireRed-OCR,2B 参数登顶文档解析榜单
小红书FireRed团队开源的FireRed-OCR(仅20亿参数),在OmniDocBench v1.5端到端评测中以92.94%综合得分登顶,超越Gemini 3.0 Pro等大模型。专注解决文档解析中的“结构幻觉”问题,通过三阶段训练+格式约束强化学习,精准还原表格、公式、多栏等复杂结构。Apache 2.0协议,ModelScope开源,支持本地商用部署。(239字)
552 22
|
18天前
|
存储 人工智能 搜索推荐
OpenClaw阿里云/本地部署保姆级指南:+21个问题让AI从执行者变专属搭档
大多数人使用OpenClaw的方式,局限于“布置任务→等待结果”的被动循环,让这个强大的AI工具沦为“高级打杂工”。但实际上,每次交互中,OpenClaw都在默默积累关于你的工作节奏、决策偏好、高频痛点等隐性信息——只要善用方法,就能让它从“等指令的执行者”升级为“懂你、主动替你思考”的专属搭档。
295 14
|
4天前
|
人工智能 自然语言处理 算法
智变之下:AI对金融行业的颠覆性冲击
随着人工智能技术进入规模化落地阶段,其对各行业的重构力度持续升级。在众多受影响行业中,金融行业凭借其标准化、数据驱动的特性,成为AI冲击力最强的领域。本文从业务流程、岗位结构、产业模式三个维度,结合AI在风控、服务、运营等场景的应用案例,剖析AI对金融行业的颠覆性影响,同时探讨冲击背后的行业转型机遇与挑战,论证金融行业是AI发展冲击最深远、最彻底的行业,其变革不仅重塑行业格局,更推动金融服务向更高效、精准、普惠的方向迭代。

热门文章

最新文章