AI时代原生专业向量检索引擎的背景是随着大模型和生成式AI时代的到来,非理化数据在市场上迎来急速的爆发且增速明显。
ABC市场调研报告表明,在2027年非流化数据的市场占比将达到86.8%,而业界处理非对话数据通常会先进行inviting的向量化,随后分析和处理向量背后的关键技术即相似性检索以及聚类分析。
项目量数据库可以提供完整的存储,因此检索的能力是处理非流化数据最佳的选择。
一、向量检索服务Milvus版云原生技术架构
在众多的开源向量数据过程中,Milvus具有极速的特点即具备极高的检索的效率,能够毫秒级的检索万亿规模的向量数据,它也具备云原生的高度弹性和可扩展的能力;Milvus面向云架构设计;Milvus的功能强大,具备混合和范围和多维检索的能力;版本发布十分迅速;背后有活跃的社区的支持,在开源的github上,短短三年多时间已经有近3万的数量。以上几点关键特性,支持Milvus成为全球最受欢迎的向量客户数据库之一。
Milvus有多种应用场景,包括动态检索、广告推荐、自动驾驶、瑞格检索以及向量增强生成。Milvus是与AI结合向量检索引擎,可以赋能支撑企业完成加速AI应用的构建,在多模态场景下可以针对向量化的图片、视频、声纹等等多种数据类型进行解锁。在广告和推荐场景下,基于向量的标签能够提升更精准、相似度更高的结果。在自动驾驶中,向量解锁能力也是核心服务。
然而客户在集群运维上存在极大的挑战。首先缺乏云上资源的支持以及快速弹性伸缩的能力,导致没有办法及时应对业务的波峰和波谷。其次内核和技术度依赖于社区的支持,运维的压力和成本较高。最后缺少云上的AI生态平滑的集成,这也是自建向量数据库普遍面临的现状和问题。基于以上几点,阿里云全托管版本的 Milvus产品应运而生。
云上托管 Milvus产品提供的能力包括高性能的企业级引擎。相比于开源版本进行功能和性能的优化,包括serverless化的权重服务,能够将所有的运维动作进行白屏化。借助云弹性和调度能力以及内核性能的提升,成本相比于自建降低30%。 Milvus和阿里云上许多AI产品进行交互,在产品上进行无缝集成,大幅的提升易用性。阿里云Milvus让用户专注在业务价值,而无需为基础向量的运维和稳定性担忧。
产品在年底进行内测,并在今年4月份进行产品公测。在8个多月内,累计开通的计算CEO总数规模达上万赫。CEO即compute unit计算单元,是一core和GB的memory,集群的开通数量达千台以上。参与测试的企业多达600多家,对线上服务的稳定性进行完整和充分的打磨。因此涵盖客户应用场景十分广泛,包括电商应用的多模态检索、互联网酒店搜索以及多样化AI企业场景。绝大部分客户在测试之后选择使用阿里云支持生产业务。因此经历一系列产品核心能力打磨和功能的标准化的阿里云能够为客户提供服务的sla等级达到99.9%以上。
产品提供企业级的向上结算内核,相比于开源版本有3~10倍的性能的提升,并且100%兼容开源。其次solace平台提供分钟级开通以及托管和开箱即用就无需再对进行运维。之后就是云原生的环境提供弹性过从容、高考用和容灾的能力,通过以上的能力,可以帮助客户进行有效的TCL的降低。
阿里云联合集成云服务的上下游链路,在生态上继续与平台通义等AI产品矩阵进行集成,促进企业AI场景的落地。涉及的模型包括model selling、model training、摩搭,提供更快捷产品体验。
二、阿里云向量引擎快速搭建企业级RAG最佳实践
技术架构在管控平台提供管理,包括指标监控、弹性扩缩、诊断分析以及版本升级。一系列管控能力帮助客户简化运维操作。在组件层面对元数据的etc和实时数据流量进行中心化托管和混合部署。在worker层面查询数据节点和索引节点进行隔离以及扩缩容。在引擎层面,基于企业级的向量引擎提供强劲的内核支撑。在资源层面基于pix统一资源池灵活扩展提供原生安全隔离环境。
基于阿里云的对象存储提供非结构化数据的数据,针对变速箱的读写和流量进行监控和观测,能够及时发现限流问题并提升带宽。
在企业性能方面,进行阿里Milvus和社区版本的性能对比。与qps、内存以及时延关键维度的指标相比,总体性能相比于开源平均提升3~10倍,依靠大量的工程和算法优化,包括自适应索引能力auto index,自动选择适合于数据集的索引和搜索的策略。
对于开发者而言不需要关心所有参数,只需提供更好的性能和检索质量。Milvus进行特有检测能力的优化,包括对通用型性能优化以及过滤检索和二进制数据结构类型的优化。
针对检索能力优化进一步进行Mark,结果表明在通用性能型场景下提升3~10倍。容量型优化节省客户20%~40的优内存和50%的磁盘,对于其他的场景性能平均提升百分之2~4倍。
基于财运伸缩以及存储和平台调度能力进行极致的降本,根据业务特点,例如预测双十一大促对在线业务提前对资源进行扩容、针对实际场景进行弹性的设置、查询负载的高峰期、对查询进行扩充。通过三个标杆客户的实测对比,开源的资源成本降低30%以上。基于平台的service底座大幅提升稳定性和可观性。
首先solid提供基于统一坚持的分钟级别的实力的构建,第二云原生环境提供多租硬隔离和安全能力,第三架构提供高可用多副本以及稳定性保障,并且屏蔽底层资源异构机型的支持,第四点稳定保证对实力的监控和主动运维。基于以上平台和引擎能力,为企业客户提供多种适用于AI研发的流程的支持。
企业典型的开发流程包括技术方案的选型、小规模的poc以及到生产环境部署。为广大客户提供前期免费的测试以及生产转正,在产品上提供入门版的standalone的部署形态和快速进行pos的验证,以及标准版的集训分布式。
针对不同客户的业务场景提供多种规格。对于性能型针对低时延和高吞吐的场景进行设计。对于容量型是处理大量数据场景的支持,除此之外在硬件层面上支持包括叉86和APP的架构。对于CPU的支持和阿里云上的各大AI平台进行横向的集成,提供各类AI的解决方案,包括派es包括通义模搭、太原lung,Luncheon和拉曼index,降低用户的集成成本。
三、基于阿里云Milvus与PAI-EAS快速搭建RAG应用
基于阿里的Milvus和PAI-EAS进行快速搭建rag的应用结合云上service托管版,即使是小白用户,也可以在几分钟之内快速搭建起一套reg应用。
典型的web的应用流程在离线过程可以把知识库进行分片trunk,通过引发类模型进行文本向量化存到Milvus,在在线过程中用户对提问内容可以进行现代化,同时利用混合查询和重排序的能力,找到相似性检索top的提问内容,重新构建最终prompt。最终的大模型会更精准的输入回答,避免常见的幻觉问题。
第二个案例是具体客户的落地,阿里云Milvus成功助力识货APP的电商搭建。客户的最大特点是引导占成交占比超50%,是占内最重要的功能之一。因此客户有三个典型的需求,期望通过引入高性能的向量搜索,提高点击率和引导的交易转化率。第二是支撑电商场景下的图片文本,非流量数据的相似性检索在生产在线业务对KPI要求非常高,第三自见运维的成本高、稳定性较差,因此希望客户的业务可以稳定可靠。在和识货的技术团队进行多次配合,为客户提供支持。在一级别的数据准确性可以支持毫秒级别的查询,同规格的qps对比提升10%。提供开箱即用的全款服务,极大的缓解运维人员的精力和负担。