客户简介
识货,成立于2012年6月,致力于为广大用户提供专业的网购决策指导,为喜欢追求性价比的网购朋友带来及时劲爆的运动、潮流、生活、时尚等网购优惠资讯,产品覆盖国内外主流购物商城。它提供了全球范围内的时尚品牌、潮流单品的信息,帮助用户发现和购买最新、最热、最具性价比的时尚商品。
业务挑战
随着业务规模的持续扩展,识货面临着如下痛点:
痛点1:商品类目快速增长,面临性能与效果的挑战
例如在查看全网低价渠道的场景中,需要将识货中的商品关联到不同渠道商家或平台,这样用户在购买时就可以清晰对比不同渠道的商品价格。对IPhone这类头部商品,识货选择人工强关联的维护方式,而对于大量的中长尾商品,识货初期的方案是选择“全文检索匹配+人工审核组合”的方式。但是随着商品品类的快速增长,初期方案的召回率和准确率都难以得到满足。
所以,识货技术团队决策使用“向量检索+全文+人工审核组合的方式”,在线上业务中增加准确性更高的向量召回链路。
痛点2:保障集群稳定性,平衡成本与可用性
在业务初期,识货选择自建Milvus集群的方式,但是在日常写入数据的性能测试过程中,集群部分节点的CPU常在50%-100%的范围波动,如此大范围的波动增加的集群的不稳定性。随着业务规模的扩大,如何更好的保障集群稳定性,保证线上业务的平稳运行是识货遇到的第二大挑战。
所以,识货技术团队考虑稳定性更高的向量服务。
痛点3:轻量化管理和运维,降低管理和运维的复杂度
随着自建集群规模的增长,管理和运维的成本也在逐步上升。例如对集群各个节点监控、一键告警、计算资源的平滑升配、内核版本无缝升级等能力也需要投入大量人力进行管理和维护,如何做到高效且低复杂的管理和运维集群是识货面临的第三大难点。
所以,识货技术团队考虑全托管的免运维的云原生向量服务。
解决方案
对于大量非结构数据的检索,通常采用向量检索的方式,识货对比了火山云 VikingDB,开源版 Elasticsearch、开源 Milvus 以及阿里云向量检索 Milvus 版,对比细节如下:
- 火山云 VikingDB 不支持 VPC 部署,而跨云不能满足时延需求;
- 开源版 Elasticsearch 为搜索引擎,支持的向量检索索引类型较少;
- 开源 Milvus 是云原生为向量检索而设计的专业向量引擎,支持多达11种向量索引,能够对数亿向量数据集进行搜索,检索效率达到毫秒级,能够很好的满足识货的现有业务场景,通过公开数据集(gist-960-1m)测试,Milvus 对Top 5~100的召回率均达到99%以上,20并发的 RT 在毫秒级;
- 阿里云 Milvus 是100%兼容开源版的全托管产品,兼备了上述开源 Milvus 全部优势的同时,配套了完善的运维基建,可以一键拉起集群无缝使用,更聚焦于业务本身;
产品名 |
火山云Viking |
开源ES |
自建Milvus |
阿里云Milvus |
产品简介 |
字节团队自主研发的一套向量引擎 |
开源的高扩展的分布式全文搜索引擎 |
基于开源版本的自建Milvus服务 |
阿里云上100%兼容开源Milvus的全托管产品 |
基础使用 |
满足 |
性能不满足 |
满足 |
满足 |
运维条件 |
运维压力小 |
运维压力大 |
运维压力大 |
运维压力小 |
环境条件 |
不支持VPC部署 |
支持VPC部署 |
支持VPC部署 |
支持VPC部署 |
经过对比,识货团队确定了最终的技术选型——阿里云向量检索 Milvus 版。识货团队已经将 Milvus 与商品匹配与图片搜索系统整合,从而为数百万用户带去更好的体验。
识货业务流程架构图
识货技术团队采用控制变量对比自建集群与阿里云Mivus集群:2组集群规模相同、基准数据相同、压测时间相同、集群版本相同,经过压测对比,识货总结阿里云Milvus有以下几点重要优势:
- 稳定性更高:对比自建集群,阿里云Milvus通过优化数据读写,使得数据分布更均匀。查询性能相较于识货自建集群,整体QPS有10%左右的提升。写入性能在同等压力,写入速度TPS均为2K的条件下,阿里云Milvus集群CPU稳定在50%附近,压测过程中没有出现明显CPU波动问题,稳定性有明显优势。
- 可用性更高:对比自建集群,阿里云Milvus提供100多项监控指标,配备CPU使用率、内存使用率等多项告警指标,并支持用户创建自定义报警规则,满足不同业务场景报警逻辑。通过完善的监控告警指标,帮助识货更好地管理集群。同时阿里云Milvus提供平滑的升降配方案,随着计算资源需求的增加,识货可以灵活的选择对集群进行扩缩容。
- 管理成本更低:对比自建Milvus集群,根据识货技术团队实际测算,购买阿里云向量检索Milvus版的单集群成本每月会增加30%,但是需要投入管控、技术人员投入建设配套运维体系与基础设施,综合评估约要投入超过1/3的人力资源进行运维,因此选择云上托管的模式成本更低。
进展
目前围绕着 Milvus 上下游的产品链路,已经着手推动 RAG、多模态搜索等多个场景下 Milvus+PAI 及相关大模型的机会落地。
总结
阿里云的 Milvus 服务以其性能稳定和功能多样化的向量检索能力,为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。该服务的分布式扩展能力不仅可靠,而且能够适应日益增长的数据规模,这对于处理大规模向量数据的相似性检索服务至关重要。
识货团队对于 Milvus 的未来发展充满期待,希望能够通过不断的升级和优化,以适应更加复杂多变的业务场景需求。识货团队在将来也会继续选择和阿里云Milvus,以及阿里云更多 AI 产品及团队更紧密合作,这不仅将有助于识货团队进一步提升其产品的用户体验,并为用户提供更加精准搜索服务,同时也将有助于在电商领域探索和开辟新的市场机会。
阿里云向量检索 Milvus 版在 2024年4月正式开启公测,已有众多客户开通使用向量检索 Milvus 版。如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可钉钉扫描以下二维码加入钉钉群(群号:59530004993)咨询。
快速跳转