【2025云栖大会】AI 搜索引擎如何驱动亿级物流:货拉拉 x 阿里云 Elasticsearch

简介: 2025云栖大会 AI搜索与向量化模型专场上,拉拉 Elasticsearch技术负责人——陈敏华先生分享了 Elasticsearch 在全球化高并发业务场景下的深度实践,以及在迁移至阿里云 Elasticsearch Serverless 后的显著收益。货拉拉的案例为业界提供了可复制、可落地的技术范本。

演讲主题:AI搜索年度发布——货拉拉 Elasticsearch技术实践和AI应用

在数字化与智能化浪潮的推动下,海量数据的高效检索与实时分析,正成为各行业核心竞争力的关键之一。作为覆盖全球 14+ 市场、服务数千万用户的智慧物流与同城货运平台,货拉拉不仅在业务规模与运营效率上追求卓越,也在技术底座上不断革新。

9月26日,云栖大会AI搜索与向量引擎分论坛上货拉拉 Elasticsearch技术负责人——陈敏华先生分享了 Elasticsearch 在全球化高并发业务场景下的深度实践,以及在迁移至阿里云 Elasticsearch Serverless 后的显著收益。货拉拉的案例为业界提供了可复制、可落地的技术范本。

一、货拉拉业务与Elasticsearch技术概况

作为全球领先的智慧物流与同城货运平台,货拉拉的业务版图已遍及全球 14+ 个核心市场,在中国内地深耕 360 多个城市,连接了超过 120 万名月活跃司机与 1400 万活跃用户。

凭借阿里云等多平台技术架构,以及 Java、PHP、Golang、Python、C++ 等多语言开发支持,货拉拉能够快速适配多样化业务场景,从货运、企业物流到搬家、冷运、零担乃至汽车租售与后市场服务,全链路满足用户在不同行业和地域的运输及配套需求。数字化运营过程中,货拉拉将 Elasticsearch 技术深度应用如下:

货拉拉 ES使用场景:

  • 核心业务:高效运维、数据查询和智能化场景。通过在抢单大厅等高并发关键模块的使用,系统能够稳定应对海量请求;
  • 日志场景:借助 ELK 集群实现日志采集、处理与可视化,显著提升运维效率;
  • 多维度查询:在客服系统中,支持跨条件的多维度高效查询,让数据分析更快速、可输出;
  • AI 场景:Elasticsearch 为智能客服、图像识别及知识库检索提供了坚实的搜索与数据处理能力,助力业务全面智能化升级。

二、货拉拉 Elasticsearch 技术实践

为了应对全球化业务的海量数据与高并发需求,货拉拉构建了超大规模的 Elasticsearch 集群。该集群为货拉拉在同城货运、企业物流及多元化业务中提供了坚实的技术底座,实现数据检索的高速与稳定并行。

1、货拉拉 ES集群特点:

  • 规模大:计算资源超过 1.5 万 CPU 核心,记录数突破 40 亿,数据总量超过 4PB。
  • 并发高:集群峰值 QPS 超过 1000 万,支持 300+ 业务应用同时并发访问。
  • 实时性强:平均请求响应时间为 24ms,在高并发访问核心业务场景下仍可保持 10ms 内的超高速度。

而为了保障全球业务的连续性与高性能数据检索,货拉拉在 Elasticsearch 构建中采用了 多 AZ 架构。这一架构不仅提高了资源利用率和系统稳定性,也为海量数据场景下的扩展与灵活部署提供了坚实基础。

2、货拉拉 ES集群 多AZ架构:

  • 多可用区部署:通过将集群节点分布在不同地理位置,避免单点故障,提升系统容错能力和业务连续性。同时支持负载均衡,优化系统性能与稳定性。
  • 冷热分离集群:按数据访问频率将数据分为热、暖、冷三类,分别存储在高性能或低成本节点中,以优化资源利用、降低存储成本,并增强集群扩展能力和灵活性,适合大规模数据场景。

为保障大规模 Elasticsearch 集群在高并发业务场景下的稳定运行,货拉拉构建了功能完备的 集群管理平台。平台融合监控、应急、演练、变更治理五大模块,无论是应对业务高峰中的扩容需求,还是处理慢 SQL、索引冗余等性能瓶颈,平台都能高效协同,确保系统在全球多业务应用下持续保持高性能与高稳定性。

3、货拉拉 ES集群管理平台整体架构如下:

  • 监控平台:实现请求实时监控、资源监控、巡检告警以及异常日志监控,保障系统运行可视化与即时告警。
  • 应急平台:支持 SQL 自动查杀、集群一键扩容以及磁盘空间应急扩展等能力,应对突发问题。
  • 演练平台:进行可用区故障演练、注入故障测试与应急演练,提升系统的灾备响应能力。
  • 变更平台:提供资源申请、资源配置变更及任务管理功能,确保上线或调整过程的可控性与安全性。
  • 治理平台:进行慢 SQL 优化、索引治理及资源水位治理,从根本上提升集群性能与资源利用效率。

三、货拉拉Elasticsearch上云收益

在面对业务访问量的波动与突增时,传统的扩容方式往往存在资源浪费、人工操作低效和集群风险高等问题。阿里云 Elasticsearch 通过 Serverless 架构,显著降低了成本,更实现了高可用、高弹性和低运维干预的流量应对能力。具体如下:

1、阿里云 ES 应对不同类型流量增长的 Serverless 策略:

  • 日常业务波峰波谷
  • 传统方式:按峰值采购资源,导致资源浪费显著。
  • Serverless 优化:按日常水位保留最小资源,峰值请求弹性扩缩容,避免闲置浪费。
  • 预期内流量增长
  • 传统方式:低峰期依赖人工操作扩容,变更繁琐且耗时。
  • Serverless 优化:活动前自动调高配额,分钟级生效,实现平稳扩容、业务无感和服务稳定。
  • 非预期流量增长
  • 传统方式:依靠紧急限流与临时扩容,存在体验受损和风险高的问题。
  • Serverless 优化:小规模增长时秒级自动协同扩容,大规模增长时自动限流,保障集群稳定运行。

通过将日志集群平稳迁移至 阿里云 Elasticsearch Serverless,货拉拉在资源利用与运维效率上都获得了质的飞跃,不仅优化了技术成本结构,还显著提升了对业务流量波动的应对能力,为核心业务的稳定与高效运行提供了更坚实的后盾。

2、货拉拉将 ELK 日志迁移至阿里云 ES Serverless 后带来的收益:

  • 在高峰期,弹性写入资源可从 120CU 动态扩展到 150CU,对应写入速率维持在每秒 50万~60万次请求(QPS);
  • 在低峰期,写入资源可按需缩减至 12CU~18CU,写入速率维持在每秒 5万~8万次请求(QPS);
  • 迁移后优势显著:运维效率提升 50%、可在全天各时段灵活弹性扩缩容、资源成本下降 60%

四、结尾

在未来,货拉拉将持续深化 AI 与 Elasticsearch 的融合应用,在业务侧通过智能调度与精准匹配,全面提升运输与运营效率;在运维侧,通过 AI 驱动的巡检、预测与自动化应急响应,实现更高的系统稳定性与安全性;在研发侧,通过智能化的查询转换与技术助理能力,优化开发体验并加速产品迭代。这一系列升级,将助力货拉拉实现由数据驱动向智能驱动的全面跃迁。

了解更多:

阿里云 检索分析服务 Elasticsearch 官网:https://www.aliyun.com/product/bigdata/elasticsearch

阿里云 检索分析服务 ES Serverless 官网:https://www.aliyun.com/product/es/es-serverless


阿里云AI搜索团队打造大模型原生搜索,攻关分布式与实时检索,助力企业升级搜索与增长。

现招聘:

搜索引擎技术专家:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000101003&trace=qrcode_share

管控研发工程师:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2009043004&track_id=SSP1761801590532QwTKePtoFi4697

技术专家-AI搜索:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000098307&track_id=SSP1761801590532ANPPiMeSTo2156

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
3月前
|
存储 人工智能 Cloud Native
【2025云栖大会】AI原生搜索引擎:Elasticsearch 换“芯”
9月26日,云栖大会AI搜索与向量引擎分论坛上,阿里云智能集团技术专家 魏子珺 和爱橙科技技术专家 周文喆,详细阐释了 “AI 原生搜索引擎:Elasticsearch 换芯” 技术主题,重点围绕 AI 原生搜索内核增强技术的升级与替换。通过核心能力重构,让 Elasticsearch 在 AI 原生时代具备更强的多模态理解、自然语言处理以及深度任务执行能力,为搜索场景带来性能、智能化与可扩展性的大幅提升。
409 0
|
2月前
|
存储 自然语言处理 测试技术
一行代码,让 Elasticsearch 集群瞬间雪崩——5000W 数据压测下的性能避坑全攻略
本文深入剖析 Elasticsearch 中模糊查询的三大陷阱及性能优化方案。通过5000 万级数据量下做了高压测试,用真实数据复刻事故现场,助力开发者规避“查询雪崩”,为您的业务保驾护航。
1508 89
|
7月前
|
人工智能 运维 自然语言处理
如何在 Elasticsearch 中构建你的智能 AI 助手?
本文将带你探索一种全新的思路:如何基于 Elasticsearch 快速构建一个具备自然语言理解能力、异常检测和安全威胁识别能力的智能运维 AI 助手 。文章会围绕实际部署流程、关键技术点和典型应用场景展开,帮助你把 Elasticsearch 从“日志仓库”升级为“智能决策中枢”。
352 30
|
3月前
|
存储 人工智能 自然语言处理
阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元
本文介绍了数智化浪潮下, 阿里云 Elasticsearch 打通了 云原生内核优化、RAG 闭环方案、云原生推理平台 三大能力模块,实现了从底层到应用的全链路升级,助力企业构建面向未来的智能搜索中枢。
539 22
|
4月前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
557 9
|
人工智能 Cloud Native 搜索推荐
【2025云栖大会】阿里云AI搜索年度发布:开启Agent时代,重构搜索新范式
2025云栖大会阿里云AI搜索专场上,发布了年度AI搜索技术与产品升级成果,推出Agentic Search架构创新与云原生引擎技术突破,实现从“信息匹配”到“智能问题解决”的跨越,支持多模态检索、百亿向量处理,助力企业降本增效,推动搜索迈向主动服务新时代。
568 0
|
7天前
|
算法 搜索推荐 Serverless
为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大
Elasticsearch 7.x后默认返回10,000总数,实为Block-Max WAND算法的性能优化——跳过低分文档块以提升查询速度。强行开启`track_total_hits:true`将禁用该优化,导致CPU飙升、延迟激增。本文深入Lucene底层,解析其原理、陷阱与治理方案。
193 1
|
2月前
|
监控 Java Serverless
1TB数据,ES却收到了2TB?揪出那个客户端中的“隐形复读机”
揭秘日志服务中的“隐形复读机”:客户端因非抢先认证导致数据重复发送,带宽消耗翻倍。通过优化鉴权配置或使用Serverless监控,可轻松定位并节省50%流量成本。
224 4

热门文章

最新文章