客户案例 | 阿里云向量检索 Milvus 版在识货电商检索场景的应用与实践

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 本文分享了阿里云向量检索 Milvus 版在识货电商检索场景的应用与实践。阿里云的 Milvus 服务以其性能稳定和功能多样化的向量检索能力,为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。

客户简介

识货,成立于2012年6月,致力于为广大用户提供专业的网购决策指导,为喜欢追求性价比的网购朋友带来及时劲爆的运动、潮流、生活、时尚等网购优惠资讯,产品覆盖国内外主流购物商城。它提供了全球范围内的时尚品牌、潮流单品的信息,帮助用户发现和购买最新、最热、最具性价比的时尚商品。


业务挑战

随着业务规模的持续扩展,识货面临着如下痛点:


痛点1:商品类目快速增长,面临性能与效果的挑战

例如在查看全网低价渠道的场景中,需要将识货中的商品关联到不同渠道商家或平台,这样用户在购买时就可以清晰对比不同渠道的商品价格。对IPhone这类头部商品,识货选择人工强关联的维护方式,而对于大量的中长尾商品,识货初期的方案是选择“全文检索匹配+人工审核组合”的方式。但是随着商品品类的快速增长,初期方案的召回率和准确率都难以得到满足


所以,识货技术团队决策使用“向量检索+全文+人工审核组合的方式”,在线上业务中增加准确性更高的向量召回链路。


痛点2:保障集群稳定性,平衡成本与可用性

在业务初期,识货选择自建Milvus集群的方式,但是在日常写入数据的性能测试过程中,集群部分节点的CPU常在50%-100%的范围波动,如此大范围的波动增加的集群的不稳定性。随着业务规模的扩大,如何更好的保障集群稳定性,保证线上业务的平稳运行是识货遇到的第二大挑战。


所以,识货技术团队考虑稳定性更高的向量服务。


痛点3:轻量化管理和运维,降低管理和运维的复杂度

随着自建集群规模的增长,管理和运维的成本也在逐步上升。例如对集群各个节点监控、一键告警、计算资源的平滑升配、内核版本无缝升级等能力也需要投入大量人力进行管理和维护,如何做到高效且低复杂的管理和运维集群是识货面临的第三大难点。


所以,识货技术团队考虑全托管的免运维的云原生向量服务。


解决方案

对于大量非结构数据的检索,通常采用向量检索的方式,识货对比了火山云 VikingDB,开源版 Elasticsearch、开源 Milvus 以及阿里云向量检索 Milvus 版,对比细节如下:

  • 火山云 VikingDB 不支持 VPC 部署,而跨云不能满足时延需求;
  • 开源版 Elasticsearch 为搜索引擎,支持的向量检索索引类型较少;
  • 开源 Milvus 是云原生为向量检索而设计的专业向量引擎,支持多达11种向量索引,能够对数亿向量数据集进行搜索,检索效率达到毫秒级,能够很好的满足识货的现有业务场景,通过公开数据集(gist-960-1m)测试,Milvus 对Top 5~100的召回率均达到99%以上,20并发的 RT 在毫秒级;
  • 阿里云 Milvus 是100%兼容开源版的全托管产品,兼备了上述开源 Milvus 全部优势的同时,配套了完善的运维基建,可以一键拉起集群无缝使用,更聚焦于业务本身;


产品名

火山云Viking

开源ES

自建Milvus

阿里云Milvus

产品简介

字节团队自主研发的一套向量引擎

开源的高扩展的分布式全文搜索引擎

基于开源版本的自建Milvus服务

阿里云上100%兼容开源Milvus的全托管产品

基础使用

满足

性能不满足

满足

满足

运维条件

运维压力小

运维压力大

运维压力大

运维压力小

环境条件

不支持VPC部署

支持VPC部署

支持VPC部署

支持VPC部署


经过对比,识货团队确定了最终的技术选型——阿里云向量检索 Milvus 版。识货团队已经将 Milvus 与商品匹配与图片搜索系统整合,从而为数百万用户带去更好的体验。

识货业务流程架构图


识货技术团队采用控制变量对比自建集群与阿里云Mivus集群:2组集群规模相同、基准数据相同、压测时间相同、集群版本相同,经过压测对比,识货总结阿里云Milvus有以下几点重要优势:

  • 稳定性更高:对比自建集群,阿里云Milvus通过优化数据读写,使得数据分布更均匀。查询性能相较于识货自建集群,整体QPS有10%左右的提升。写入性能在同等压力,写入速度TPS均为2K的条件下,阿里云Milvus集群CPU稳定在50%附近,压测过程中没有出现明显CPU波动问题,稳定性有明显优势。
  • 可用性更高:对比自建集群,阿里云Milvus提供100多项监控指标,配备CPU使用率、内存使用率等多项告警指标,并支持用户创建自定义报警规则,满足不同业务场景报警逻辑。通过完善的监控告警指标,帮助识货更好地管理集群。同时阿里云Milvus提供平滑的升降配方案,随着计算资源需求的增加,识货可以灵活的选择对集群进行扩缩容。
  • 管理成本更低:对比自建Milvus集群,根据识货技术团队实际测算,购买阿里云向量检索Milvus版的单集群成本每月会增加30%,但是需要投入管控、技术人员投入建设配套运维体系与基础设施,综合评估约要投入超过1/3的人力资源进行运维,因此选择云上托管的模式成本更低。


进展

目前围绕着 Milvus 上下游的产品链路,已经着手推动 RAG、多模态搜索等多个场景下 Milvus+PAI 及相关大模型的机会落地


总结

阿里云的 Milvus 服务以其性能稳定和功能多样化的向量检索能力,为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。该服务的分布式扩展能力不仅可靠,而且能够适应日益增长的数据规模,这对于处理大规模向量数据的相似性检索服务至关重要。


识货团队对于 Milvus 的未来发展充满期待,希望能够通过不断的升级和优化,以适应更加复杂多变的业务场景需求。识货团队在将来也会继续选择和阿里云Milvus,以及阿里云更多 AI 产品及团队更紧密合作,这不仅将有助于识货团队进一步提升其产品的用户体验,并为用户提供更加精准搜索服务,同时也将有助于在电商领域探索和开辟新的市场机会。


阿里云向量检索 Milvus 版在 2024年4月正式开启公测,已有众多客户开通使用向量检索 Milvus 版。如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可钉钉扫描以下二维码加入钉钉群(群号:59530004993)咨询。


快速跳转

  1. 向量检索Milvus 官网详情页
  2. 产品文档
  3. 实践教程:通过阿里云Milvus与PAI搭建高效的检索增强生成(RAG)系统
相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
12天前
|
人工智能 自然语言处理 数据可视化
体验评测报告:阿里云百炼平台——大模型应用构建的全方位工具箱
体验评测报告:阿里云百炼平台——大模型应用构建的全方位工具箱
89 2
|
4天前
|
存储 大数据 关系型数据库
从 ClickHouse 到阿里云数据库 SelectDB 内核 Apache Doris:快成物流的数智化货运应用实践
目前已经部署在 2 套生产集群,存储数据总量达百亿规模,覆盖实时数仓、BI 多维分析、用户画像、货运轨迹信息系统等业务场景。
|
5天前
|
数据采集 人工智能 监控
阿里云百炼模型训练实战流程:从入门到实战应用
阿里云百炼是AI大模型开发平台,提供一站式服务,涵盖模型训练到部署。用户从注册登录、创建应用开始,选择模型框架,配置资源。接着,进行数据准备、预处理,上传至阿里云OSS。模型训练涉及设置参数、启动训练及调优。训练后,模型导出并部署为API,集成到应用中。平台提供监控工具确保服务性能。通过百炼,开发者能高效地进行大模型实战,开启AI创新。
46 0
|
9天前
|
安全 Java Shell
阿里云云效产品使用问题之要配置云效只重启应用的流水线,该如何操作
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
16天前
|
存储 弹性计算 Linux
阿里云账号注册、完成实名认证、试用云服务器和购买云服务器流程参考
本文为大家介绍新手用户从注册阿里云账号,完成实名认证,然后试用云服务器和购买云服务器的主要流程,适合初次购买和试用阿里云服务器的新手用户参考。
阿里云账号注册、完成实名认证、试用云服务器和购买云服务器流程参考
|
8天前
|
弹性计算 安全 前端开发
阿里云服务器ECS通用型、计算型和内存型详细介绍和性能参数表
阿里云ECS实例有计算型(c)、通用型(g)和内存型(r)三种,主要区别在于CPU和内存比例。计算型CPU内存比1:2,如2核4G;通用型为1:4,如2核8G;内存型为1:8,如2核16G。随着技术迭代,有第五代至第八代产品,如c7、g5、r8a等。每代实例在CPU型号和主频上相同,但性能有所提升。实例性能参数包括网络带宽、收发包能力、连接数等。具体应用场景如计算型适合高网络包收发、通用型适合企业级应用,内存型适合内存数据库等。详细信息可参阅阿里云ECS页面。
|
3天前
|
存储 缓存 安全
阿里云服务器实例规格选择参考:经济型、通用算力型、计算型、通用型、内存型区别
当我们在通过阿里云的各种活动选择云服务器实例规格的时候会发现,相同配置的云服务器往往有多个不同的实例可选,而且价格差别也比较大,这会是因为不同实例规格的由于采用的处理器不同,底层架构也有所不同(例如X86 计算架构与Arm 计算架构),因此不同实例的云服务器其性能与适用场景是有所不同。目前阿里云的活动中,主要的实例规格可分为经济型、通用算力型、计算型、通用型、内存型,对于很多初次接触阿里云服务器的用户来说,了解他们之间的差别就是比较重要的了,下面小编来为大家简单介绍下它们之间的区别。
阿里云服务器实例规格选择参考:经济型、通用算力型、计算型、通用型、内存型区别
|
13天前
|
存储 弹性计算 安全
阿里云服务器怎么样?云服务器ECS产品优势、应用场景、价格解析及常见问题参考
阿里云服务器ECS(Elastic Compute Service)是阿里云提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别云计算服务。把物理服务器比作买的房子,云服务器ECS,就是租赁的房子,阿里云云服务商就是管家。云服务商负责搭建机房、提供配套服务和维护,用户只需要付租金,即可“拎包入住”,无需自建机房、采购和配置硬件设施。如果不再需要云服务器,可随时“退租”(释放资源),节省成本。本文为大家解析云服务器ECS产品优势、应用场景和最新价格及常见问题。
阿里云服务器怎么样?云服务器ECS产品优势、应用场景、价格解析及常见问题参考
|
8天前
|
小程序 数据安全/隐私保护
阿里云新手入门:注册账号、实名认证、申请免费云服务器
阿里云新手指南:注册账号(手机号或支付宝快捷注册),完成实名认证(个人/企业)。通过免费服务器获取3个月试用。创建后,设置密码,远程连接,配置安全组规则,部署应用,如建站与环境安装。详询官方教程。
|
8天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU云服务器介绍_GPU租用费用_GPU优势和使用场景说明
阿里云GPU云服务器提供NVIDIA A10、V100、T4、P4、P100等GPU卡,结合高性能CPU,单实例计算性能高达5PFLOPS。支持多种实例规格,如A10卡GN7i、V100-16G卡GN6v等,应用于深度学习、科学计算等场景。GPU服务器租用费用因实例规格而异,如A10卡GN7i每月3213.99元起。阿里云还提供GPU加速软件如AIACC-Training、AIACC-Inference等。网络性能强大,VPC支持2400万PPS和160Gbps内网带宽。购买方式灵活,包括包年包月、按量付费等。客户案例包括深势科技、流利说和小牛翻译等。