阿里云Milvus产品发布:AI时代云原生专业向量检索引擎

简介: 随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。

AI时代原生专业向量检索引擎的背景是随着大模型和生成式AI时代的到来,非理化数据在市场上迎来急速的爆发且增速明显。


ABC市场调研报告表明,在2027年非流化数据的市场占比将达到86.8%,而业界处理非对话数据通常会先进行inviting的向量化,随后分析和处理向量背后的关键技术即相似性检索以及聚类分析。

项目量数据库可以提供完整的存储,因此检索的能力是处理非流化数据最佳的选择。

 

一、向量检索服务Milvus版云原生技术架构

在众多的开源向量数据过程中,Milvus具有极速的特点即具备极高的检索的效率,能够毫秒级的检索万亿规模的向量数据,它也具备云原生的高度弹性和可扩展的能力;Milvus面向云架构设计;Milvus的功能强大,具备混合和范围和多维检索的能力;版本发布十分迅速;背后有活跃的社区的支持,在开源的github上,短短三年多时间已经有近3万的数量。以上几点关键特性,支持Milvus成为全球最受欢迎的向量客户数据库之一。


Milvus有多种应用场景,包括动态检索、广告推荐、自动驾驶、瑞格检索以及向量增强生成。Milvus是与AI结合向量检索引擎,可以赋能支撑企业完成加速AI应用的构建,在多模态场景下可以针对向量化的图片、视频、声纹等等多种数据类型进行解锁。在广告和推荐场景下,基于向量的标签能够提升更精准、相似度更高的结果。在自动驾驶中,向量解锁能力也是核心服务。


然而客户在集群运维上存在极大的挑战。首先缺乏云上资源的支持以及快速弹性伸缩的能力,导致没有办法及时应对业务的波峰和波谷。其次内核和技术度依赖于社区的支持,运维的压力和成本较高。最后缺少云上的AI生态平滑的集成,这也是自建向量数据库普遍面临的现状和问题。基于以上几点,阿里云全托管版本的 Milvus产品应运而生。


云上托管 Milvus产品提供的能力包括高性能的企业级引擎。相比于开源版本进行功能和性能的优化,包括serverless化的权重服务,能够将所有的运维动作进行白屏化。借助云弹性和调度能力以及内核性能的提升,成本相比于自建降低30%。 Milvus和阿里云上许多AI产品进行交互,在产品上进行无缝集成,大幅的提升易用性。阿里云Milvus让用户专注在业务价值,而无需为基础向量的运维和稳定性担忧。


产品在年底进行内测,并在今年4月份进行产品公测。在8个多月内,累计开通的计算CEO总数规模达上万赫。CEO即compute unit计算单元,是一core和GB的memory,集群的开通数量达千台以上。参与测试的企业多达600多家,对线上服务的稳定性进行完整和充分的打磨。因此涵盖客户应用场景十分广泛,包括电商应用的多模态检索、互联网酒店搜索以及多样化AI企业场景。绝大部分客户在测试之后选择使用阿里云支持生产业务。因此经历一系列产品核心能力打磨和功能的标准化的阿里云能够为客户提供服务的sla等级达到99.9%以上。


产品提供企业级的向上结算内核,相比于开源版本有3~10倍的性能的提升,并且100%兼容开源。其次solace平台提供分钟级开通以及托管和开箱即用就无需再对进行运维。之后就是云原生的环境提供弹性过从容、高考用和容灾的能力,通过以上的能力,可以帮助客户进行有效的TCL的降低。


阿里云联合集成云服务的上下游链路,在生态上继续与平台通义等AI产品矩阵进行集成,促进企业AI场景的落地。涉及的模型包括model selling、model training、摩搭,提供更快捷产品体验。

 

二、阿里云向量引擎快速搭建企业级RAG最佳实践

技术架构在管控平台提供管理,包括指标监控、弹性扩缩、诊断分析以及版本升级。一系列管控能力帮助客户简化运维操作。在组件层面对元数据的etc和实时数据流量进行中心化托管和混合部署。在worker层面查询数据节点和索引节点进行隔离以及扩缩容。在引擎层面,基于企业级的向量引擎提供强劲的内核支撑。在资源层面基于pix统一资源池灵活扩展提供原生安全隔离环境。


基于阿里云的对象存储提供非结构化数据的数据,针对变速箱的读写和流量进行监控和观测,能够及时发现限流问题并提升带宽。


在企业性能方面,进行阿里Milvus和社区版本的性能对比。与qps、内存以及时延关键维度的指标相比,总体性能相比于开源平均提升3~10倍,依靠大量的工程和算法优化,包括自适应索引能力auto index,自动选择适合于数据集的索引和搜索的策略。


对于开发者而言不需要关心所有参数,只需提供更好的性能和检索质量。Milvus进行特有检测能力的优化,包括对通用型性能优化以及过滤检索和二进制数据结构类型的优化。


针对检索能力优化进一步进行Mark,结果表明在通用性能型场景下提升3~10倍。容量型优化节省客户20%~40的优内存和50%的磁盘,对于其他的场景性能平均提升百分之2~4倍。


基于财运伸缩以及存储和平台调度能力进行极致的降本,根据业务特点,例如预测双十一大促对在线业务提前对资源进行扩容、针对实际场景进行弹性的设置、查询负载的高峰期、对查询进行扩充。通过三个标杆客户的实测对比,开源的资源成本降低30%以上。基于平台的service底座大幅提升稳定性和可观性。


首先solid提供基于统一坚持的分钟级别的实力的构建,第二云原生环境提供多租硬隔离和安全能力,第三架构提供高可用多副本以及稳定性保障,并且屏蔽底层资源异构机型的支持,第四点稳定保证对实力的监控和主动运维。基于以上平台和引擎能力,为企业客户提供多种适用于AI研发的流程的支持。


企业典型的开发流程包括技术方案的选型、小规模的poc以及到生产环境部署。为广大客户提供前期免费的测试以及生产转正,在产品上提供入门版的standalone的部署形态和快速进行pos的验证,以及标准版的集训分布式。


针对不同客户的业务场景提供多种规格。对于性能型针对低时延和高吞吐的场景进行设计。对于容量型是处理大量数据场景的支持,除此之外在硬件层面上支持包括叉86和APP的架构。对于CPU的支持和阿里云上的各大AI平台进行横向的集成,提供各类AI的解决方案,包括派es包括通义模搭、太原lung,Luncheon和拉曼index,降低用户的集成成本。

 

三、基于阿里云Milvus与PAI-EAS快速搭建RAG应用

基于阿里的Milvus和PAI-EAS进行快速搭建rag的应用结合云上service托管版,即使是小白用户,也可以在几分钟之内快速搭建起一套reg应用。


典型的web的应用流程在离线过程可以把知识库进行分片trunk,通过引发类模型进行文本向量化存到Milvus,在在线过程中用户对提问内容可以进行现代化,同时利用混合查询和重排序的能力,找到相似性检索top的提问内容,重新构建最终prompt。最终的大模型会更精准的输入回答,避免常见的幻觉问题。


第二个案例是具体客户的落地,阿里云Milvus成功助力识货APP的电商搭建。客户的最大特点是引导占成交占比超50%,是占内最重要的功能之一。因此客户有三个典型的需求,期望通过引入高性能的向量搜索,提高点击率和引导的交易转化率。第二是支撑电商场景下的图片文本,非流量数据的相似性检索在生产在线业务对KPI要求非常高,第三自见运维的成本高、稳定性较差,因此希望客户的业务可以稳定可靠。在和识货的技术团队进行多次配合,为客户提供支持。在一级别的数据准确性可以支持毫秒级别的查询,同规格的qps对比提升10%。提供开箱即用的全款服务,极大的缓解运维人员的精力和负担。

 

相关文章
|
3月前
|
人工智能 文字识别 监控
|
3月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
2966 166
|
3月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
3月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
3月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
671 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
3月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI任务调度
PAI平台参加“周二开源日”活动,本期分享核心内容摘要 一、AI任务的需求与DLC 二、KubeDL 三、KubeDLPro 四、总结
2221 0
云原生场景中的 AI任务调度
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI 任务调度|学习笔记
快速学习云原生场景中的 AI 任务调度。
1168 0
云原生场景中的 AI 任务调度|学习笔记
|
3月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
913 49

热门文章

最新文章