客户案例 | 阿里云向量检索 Milvus 版在识货电商检索场景的应用与实践

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 本文分享了阿里云向量检索 Milvus 版在识货电商检索场景的应用与实践。阿里云的 Milvus 服务以其性能稳定和功能多样化的向量检索能力,为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。

客户简介

识货,成立于2012年6月,致力于为广大用户提供专业的网购决策指导,为喜欢追求性价比的网购朋友带来及时劲爆的运动、潮流、生活、时尚等网购优惠资讯,产品覆盖国内外主流购物商城。它提供了全球范围内的时尚品牌、潮流单品的信息,帮助用户发现和购买最新、最热、最具性价比的时尚商品。


业务挑战

随着业务规模的持续扩展,识货面临着如下痛点:


痛点1:商品类目快速增长,面临性能与效果的挑战

例如在查看全网低价渠道的场景中,需要将识货中的商品关联到不同渠道商家或平台,这样用户在购买时就可以清晰对比不同渠道的商品价格。对IPhone这类头部商品,识货选择人工强关联的维护方式,而对于大量的中长尾商品,识货初期的方案是选择“全文检索匹配+人工审核组合”的方式。但是随着商品品类的快速增长,初期方案的召回率和准确率都难以得到满足


所以,识货技术团队决策使用“向量检索+全文+人工审核组合的方式”,在线上业务中增加准确性更高的向量召回链路。


痛点2:保障集群稳定性,平衡成本与可用性

在业务初期,识货选择自建Milvus集群的方式,但是在日常写入数据的性能测试过程中,集群部分节点的CPU常在50%-100%的范围波动,如此大范围的波动增加的集群的不稳定性。随着业务规模的扩大,如何更好的保障集群稳定性,保证线上业务的平稳运行是识货遇到的第二大挑战。


所以,识货技术团队考虑稳定性更高的向量服务。


痛点3:轻量化管理和运维,降低管理和运维的复杂度

随着自建集群规模的增长,管理和运维的成本也在逐步上升。例如对集群各个节点监控、一键告警、计算资源的平滑升配、内核版本无缝升级等能力也需要投入大量人力进行管理和维护,如何做到高效且低复杂的管理和运维集群是识货面临的第三大难点。


所以,识货技术团队考虑全托管的免运维的云原生向量服务。


解决方案

对于大量非结构数据的检索,通常采用向量检索的方式,识货对比了火山云 VikingDB,开源版 Elasticsearch、开源 Milvus 以及阿里云向量检索 Milvus 版,对比细节如下:

  • 火山云 VikingDB 不支持 VPC 部署,而跨云不能满足时延需求;
  • 开源版 Elasticsearch 为搜索引擎,支持的向量检索索引类型较少;
  • 开源 Milvus 是云原生为向量检索而设计的专业向量引擎,支持多达11种向量索引,能够对数亿向量数据集进行搜索,检索效率达到毫秒级,能够很好的满足识货的现有业务场景,通过公开数据集(gist-960-1m)测试,Milvus 对Top 5~100的召回率均达到99%以上,20并发的 RT 在毫秒级;
  • 阿里云 Milvus 是100%兼容开源版的全托管产品,兼备了上述开源 Milvus 全部优势的同时,配套了完善的运维基建,可以一键拉起集群无缝使用,更聚焦于业务本身;


产品名

火山云Viking

开源ES

自建Milvus

阿里云Milvus

产品简介

字节团队自主研发的一套向量引擎

开源的高扩展的分布式全文搜索引擎

基于开源版本的自建Milvus服务

阿里云上100%兼容开源Milvus的全托管产品

基础使用

满足

性能不满足

满足

满足

运维条件

运维压力小

运维压力大

运维压力大

运维压力小

环境条件

不支持VPC部署

支持VPC部署

支持VPC部署

支持VPC部署


经过对比,识货团队确定了最终的技术选型——阿里云向量检索 Milvus 版。识货团队已经将 Milvus 与商品匹配与图片搜索系统整合,从而为数百万用户带去更好的体验。

识货业务流程架构图


识货技术团队采用控制变量对比自建集群与阿里云Mivus集群:2组集群规模相同、基准数据相同、压测时间相同、集群版本相同,经过压测对比,识货总结阿里云Milvus有以下几点重要优势:

  • 稳定性更高:对比自建集群,阿里云Milvus通过优化数据读写,使得数据分布更均匀。查询性能相较于识货自建集群,整体QPS有10%左右的提升。写入性能在同等压力,写入速度TPS均为2K的条件下,阿里云Milvus集群CPU稳定在50%附近,压测过程中没有出现明显CPU波动问题,稳定性有明显优势。
  • 可用性更高:对比自建集群,阿里云Milvus提供100多项监控指标,配备CPU使用率、内存使用率等多项告警指标,并支持用户创建自定义报警规则,满足不同业务场景报警逻辑。通过完善的监控告警指标,帮助识货更好地管理集群。同时阿里云Milvus提供平滑的升降配方案,随着计算资源需求的增加,识货可以灵活的选择对集群进行扩缩容。
  • 管理成本更低:对比自建Milvus集群,根据识货技术团队实际测算,购买阿里云向量检索Milvus版的单集群成本每月会增加30%,但是需要投入管控、技术人员投入建设配套运维体系与基础设施,综合评估约要投入超过1/3的人力资源进行运维,因此选择云上托管的模式成本更低。


进展

目前围绕着 Milvus 上下游的产品链路,已经着手推动 RAG、多模态搜索等多个场景下 Milvus+PAI 及相关大模型的机会落地


总结

阿里云的 Milvus 服务以其性能稳定和功能多样化的向量检索能力,为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。该服务的分布式扩展能力不仅可靠,而且能够适应日益增长的数据规模,这对于处理大规模向量数据的相似性检索服务至关重要。


识货团队对于 Milvus 的未来发展充满期待,希望能够通过不断的升级和优化,以适应更加复杂多变的业务场景需求。识货团队在将来也会继续选择和阿里云Milvus,以及阿里云更多 AI 产品及团队更紧密合作,这不仅将有助于识货团队进一步提升其产品的用户体验,并为用户提供更加精准搜索服务,同时也将有助于在电商领域探索和开辟新的市场机会。


阿里云向量检索 Milvus 版在 2024年4月正式开启公测,已有众多客户开通使用向量检索 Milvus 版。如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可钉钉扫描以下二维码加入钉钉群(群号:59530004993)咨询。


快速跳转

  1. 向量检索Milvus 官网详情页
  2. 产品文档
  3. 实践教程:通过阿里云Milvus与PAI搭建高效的检索增强生成(RAG)系统
相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
20天前
|
存储 SQL BI
毫秒级查询性能优化实践!基于阿里云数据库 SelectDB 版内核:Apache Doris 在极越汽车数字化运营和营销方向的解决方案
毫秒级查询性能优化实践!基于阿里云数据库 SelectDB 版内核:Apache Doris 在极越汽车数字化运营和营销方向的解决方案
毫秒级查询性能优化实践!基于阿里云数据库 SelectDB 版内核:Apache Doris 在极越汽车数字化运营和营销方向的解决方案
|
22天前
|
算法 物联网 数据库
阿里云 OpenSearch RAG 应用实践
本文介绍了阿里云OpenSearch在过去一年中在RAG方面的应用和探索。
542 2
阿里云 OpenSearch RAG 应用实践
|
28天前
|
弹性计算 监控 开发工具
【阿里云弹性计算】阿里云ECS的网络优化实践:VPC配置与网络性能提升
【5月更文挑战第29天】阿里云ECS通过虚拟私有云(VPC)提供高性能、安全的网络环境。VPC允许用户自定义IP地址、路由规则和安全组。配置包括:创建VPC和交换机,设定安全组,然后创建ECS实例并绑定。优化网络性能涉及规划网络拓扑、优化路由、启用网络加速功能(如ENI和EIP)及监控网络性能。示例代码展示了使用Python SDK创建VPC和交换机的过程。
277 3
|
5天前
|
存储 弹性计算 安全
构建高效企业应用架构:阿里云产品组合实践深度解析
该方案展现了阿里云产品组合的强大能力和灵活性,不仅满足了当前业务需求,也为未来的扩展打下了坚实的基础。希望本文的分享能为读者在设计自己的IT解决方案时提供一定的参考和启发。
68 1
|
9天前
|
负载均衡 测试技术 网络安全
阿里云服务网格ASM多集群实践(一)多集群管理概述
服务网格多集群管理网络打通和部署模式的多种最佳实践
|
5天前
|
存储 弹性计算 Linux
阿里云账号注册、完成实名认证、试用云服务器和购买云服务器流程参考
本文为大家介绍新手用户从注册阿里云账号,完成实名认证,然后试用云服务器和购买云服务器的主要流程,适合初次购买和试用阿里云服务器的新手用户参考。
阿里云账号注册、完成实名认证、试用云服务器和购买云服务器流程参考
|
28天前
|
存储 固态存储 安全
阿里云4核CPU云服务器价格参考,最新收费标准和活动价格
阿里云4核CPU云服务器多少钱?阿里云服务器核数是指虚拟出来的CPU处理器的核心数量,准确来讲应该是vCPU。CPU核心数的大小代表了云服务器的运算能力,CPU越高,云服务器的性能越好。阿里云服务器1核CPU就是一个超线程,2核CPU2个超线程,4核CPU4个超线程,这样云服务器可以同时处理多个任务,计算性能更强。如果网站流程较小,少量图片展示的企业网站,建议选择2核及以上CPU;如果网站流量较大,动态页面比较多,有视频等,建议选择4核、8核以上CPU。
阿里云4核CPU云服务器价格参考,最新收费标准和活动价格
|
2天前
|
存储 弹性计算 安全
阿里云服务器怎么样?云服务器ECS产品优势、应用场景、价格解析及常见问题参考
阿里云服务器ECS(Elastic Compute Service)是阿里云提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别云计算服务。把物理服务器比作买的房子,云服务器ECS,就是租赁的房子,阿里云云服务商就是管家。云服务商负责搭建机房、提供配套服务和维护,用户只需要付租金,即可“拎包入住”,无需自建机房、采购和配置硬件设施。如果不再需要云服务器,可随时“退租”(释放资源),节省成本。本文为大家解析云服务器ECS产品优势、应用场景和最新价格及常见问题。
阿里云服务器怎么样?云服务器ECS产品优势、应用场景、价格解析及常见问题参考
|
26天前
|
存储 固态存储 安全
租用阿里云企业级云服务器最新收费标准与活动价格参考
租用阿里云企业级云服务器多少钱?阿里云服务器有多种实例分类,其中通用型、计算型、内存型、通用算力型、大数据型、本地SSD、高主频型和增强型均属于企业级云服务器,目前在阿里云的活动中,通用型、计算型、内存型和通用算力型均有优惠,下面是阿里云企业级云服务器价格表,包含最新收费标准与活动价格,以表格形式展示给大家,以供参考和了解。
租用阿里云企业级云服务器最新收费标准与活动价格参考
|
9天前
|
弹性计算
2024年阿里云免费云服务器及学生三百通用额度申请教程参考
阿里云2024年继续提供免费学生云服务器,最长可享7个月(1+6个月);还有300元无门槛抵用金,适用于全量公共云产品(特殊商品除外)。学生需完成身份认证和任务以领取和续费。此外,有3个月免费的飞天试用云服务器,分为个人和企业版。详细申请教程包括学生认证、试用产品选择等步骤,可访问指定阿里云链接进行操作。
290 2