阿里云Milvus产品发布:AI时代云原生专业向量检索引擎

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。

AI时代原生专业向量检索引擎的背景是随着大模型和生成式AI时代的到来,非理化数据在市场上迎来急速的爆发且增速明显。


ABC市场调研报告表明,在2027年非流化数据的市场占比将达到86.8%,而业界处理非对话数据通常会先进行inviting的向量化,随后分析和处理向量背后的关键技术即相似性检索以及聚类分析。

项目量数据库可以提供完整的存储,因此检索的能力是处理非流化数据最佳的选择。

 

一、向量检索服务Milvus版云原生技术架构

在众多的开源向量数据过程中,Milvus具有极速的特点即具备极高的检索的效率,能够毫秒级的检索万亿规模的向量数据,它也具备云原生的高度弹性和可扩展的能力;Milvus面向云架构设计;Milvus的功能强大,具备混合和范围和多维检索的能力;版本发布十分迅速;背后有活跃的社区的支持,在开源的github上,短短三年多时间已经有近3万的数量。以上几点关键特性,支持Milvus成为全球最受欢迎的向量客户数据库之一。


Milvus有多种应用场景,包括动态检索、广告推荐、自动驾驶、瑞格检索以及向量增强生成。Milvus是与AI结合向量检索引擎,可以赋能支撑企业完成加速AI应用的构建,在多模态场景下可以针对向量化的图片、视频、声纹等等多种数据类型进行解锁。在广告和推荐场景下,基于向量的标签能够提升更精准、相似度更高的结果。在自动驾驶中,向量解锁能力也是核心服务。


然而客户在集群运维上存在极大的挑战。首先缺乏云上资源的支持以及快速弹性伸缩的能力,导致没有办法及时应对业务的波峰和波谷。其次内核和技术度依赖于社区的支持,运维的压力和成本较高。最后缺少云上的AI生态平滑的集成,这也是自建向量数据库普遍面临的现状和问题。基于以上几点,阿里云全托管版本的 Milvus产品应运而生。


云上托管 Milvus产品提供的能力包括高性能的企业级引擎。相比于开源版本进行功能和性能的优化,包括serverless化的权重服务,能够将所有的运维动作进行白屏化。借助云弹性和调度能力以及内核性能的提升,成本相比于自建降低30%。 Milvus和阿里云上许多AI产品进行交互,在产品上进行无缝集成,大幅的提升易用性。阿里云Milvus让用户专注在业务价值,而无需为基础向量的运维和稳定性担忧。


产品在年底进行内测,并在今年4月份进行产品公测。在8个多月内,累计开通的计算CEO总数规模达上万赫。CEO即compute unit计算单元,是一core和GB的memory,集群的开通数量达千台以上。参与测试的企业多达600多家,对线上服务的稳定性进行完整和充分的打磨。因此涵盖客户应用场景十分广泛,包括电商应用的多模态检索、互联网酒店搜索以及多样化AI企业场景。绝大部分客户在测试之后选择使用阿里云支持生产业务。因此经历一系列产品核心能力打磨和功能的标准化的阿里云能够为客户提供服务的sla等级达到99.9%以上。


产品提供企业级的向上结算内核,相比于开源版本有3~10倍的性能的提升,并且100%兼容开源。其次solace平台提供分钟级开通以及托管和开箱即用就无需再对进行运维。之后就是云原生的环境提供弹性过从容、高考用和容灾的能力,通过以上的能力,可以帮助客户进行有效的TCL的降低。


阿里云联合集成云服务的上下游链路,在生态上继续与平台通义等AI产品矩阵进行集成,促进企业AI场景的落地。涉及的模型包括model selling、model training、摩搭,提供更快捷产品体验。

 

二、阿里云向量引擎快速搭建企业级RAG最佳实践

技术架构在管控平台提供管理,包括指标监控、弹性扩缩、诊断分析以及版本升级。一系列管控能力帮助客户简化运维操作。在组件层面对元数据的etc和实时数据流量进行中心化托管和混合部署。在worker层面查询数据节点和索引节点进行隔离以及扩缩容。在引擎层面,基于企业级的向量引擎提供强劲的内核支撑。在资源层面基于pix统一资源池灵活扩展提供原生安全隔离环境。


基于阿里云的对象存储提供非结构化数据的数据,针对变速箱的读写和流量进行监控和观测,能够及时发现限流问题并提升带宽。


在企业性能方面,进行阿里Milvus和社区版本的性能对比。与qps、内存以及时延关键维度的指标相比,总体性能相比于开源平均提升3~10倍,依靠大量的工程和算法优化,包括自适应索引能力auto index,自动选择适合于数据集的索引和搜索的策略。


对于开发者而言不需要关心所有参数,只需提供更好的性能和检索质量。Milvus进行特有检测能力的优化,包括对通用型性能优化以及过滤检索和二进制数据结构类型的优化。


针对检索能力优化进一步进行Mark,结果表明在通用性能型场景下提升3~10倍。容量型优化节省客户20%~40的优内存和50%的磁盘,对于其他的场景性能平均提升百分之2~4倍。


基于财运伸缩以及存储和平台调度能力进行极致的降本,根据业务特点,例如预测双十一大促对在线业务提前对资源进行扩容、针对实际场景进行弹性的设置、查询负载的高峰期、对查询进行扩充。通过三个标杆客户的实测对比,开源的资源成本降低30%以上。基于平台的service底座大幅提升稳定性和可观性。


首先solid提供基于统一坚持的分钟级别的实力的构建,第二云原生环境提供多租硬隔离和安全能力,第三架构提供高可用多副本以及稳定性保障,并且屏蔽底层资源异构机型的支持,第四点稳定保证对实力的监控和主动运维。基于以上平台和引擎能力,为企业客户提供多种适用于AI研发的流程的支持。


企业典型的开发流程包括技术方案的选型、小规模的poc以及到生产环境部署。为广大客户提供前期免费的测试以及生产转正,在产品上提供入门版的standalone的部署形态和快速进行pos的验证,以及标准版的集训分布式。


针对不同客户的业务场景提供多种规格。对于性能型针对低时延和高吞吐的场景进行设计。对于容量型是处理大量数据场景的支持,除此之外在硬件层面上支持包括叉86和APP的架构。对于CPU的支持和阿里云上的各大AI平台进行横向的集成,提供各类AI的解决方案,包括派es包括通义模搭、太原lung,Luncheon和拉曼index,降低用户的集成成本。

 

三、基于阿里云Milvus与PAI-EAS快速搭建RAG应用

基于阿里的Milvus和PAI-EAS进行快速搭建rag的应用结合云上service托管版,即使是小白用户,也可以在几分钟之内快速搭建起一套reg应用。


典型的web的应用流程在离线过程可以把知识库进行分片trunk,通过引发类模型进行文本向量化存到Milvus,在在线过程中用户对提问内容可以进行现代化,同时利用混合查询和重排序的能力,找到相似性检索top的提问内容,重新构建最终prompt。最终的大模型会更精准的输入回答,避免常见的幻觉问题。


第二个案例是具体客户的落地,阿里云Milvus成功助力识货APP的电商搭建。客户的最大特点是引导占成交占比超50%,是占内最重要的功能之一。因此客户有三个典型的需求,期望通过引入高性能的向量搜索,提高点击率和引导的交易转化率。第二是支撑电商场景下的图片文本,非流量数据的相似性检索在生产在线业务对KPI要求非常高,第三自见运维的成本高、稳定性较差,因此希望客户的业务可以稳定可靠。在和识货的技术团队进行多次配合,为客户提供支持。在一级别的数据准确性可以支持毫秒级别的查询,同规格的qps对比提升10%。提供开箱即用的全款服务,极大的缓解运维人员的精力和负担。

 

相关文章
|
3天前
|
机器学习/深度学习 人工智能 算法
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
FinRobot 是一个开源的 AI Agent 平台,专注于金融领域的应用,通过大型语言模型(LLMs)构建复杂的金融分析和决策工具,提供市场预测、文档分析和交易策略等多种功能。
48 13
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
|
2天前
|
监控 安全 Cloud Native
阿里云容器服务&云安全中心团队荣获信通院“云原生安全标杆案例”奖
2024年12月24日,阿里云容器服务团队与云安全中心团队获得中国信息通信研究院「云原生安全标杆案例」奖。
|
2天前
|
负载均衡 容灾 Cloud Native
云原生应用网关进阶:阿里云网络ALB Ingress 全能增强
在过去半年,ALB Ingress Controller推出了多项高级特性,包括支持AScript自定义脚本、慢启动、连接优雅中断等功能,增强了产品的灵活性和用户体验。此外,还推出了ingress2Albconfig工具,方便用户从Nginx Ingress迁移到ALB Ingress,以及通过Webhook服务实现更智能的配置校验,减少错误配置带来的影响。在容灾部署方面,支持了多集群网关,提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。
34 4
|
2天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
4天前
|
人工智能 Cloud Native 数据管理
数据+AI融合趋势洞察暨阿里云OpenLake解决方案发布
Forrester是全球领先的市场研究与咨询机构,专注于新兴技术在各领域的应用。本文探讨如何加速现代数据管理,推动人工智能与客户业务的融合创新。面对数据标准缺乏、多云环境复杂性、新兴业务场景及过多数据平台等挑战,Forrester提出构建AI就绪的数据管理基石,通过互联智能框架、全局数据管理和DataOps、端到端数据管理能力、AI赋能的数据管理以及用例驱动的策略,帮助企业实现数据和AI的深度融合,提升业务价值并降低管理成本。
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI任务调度
PAI平台参加“周二开源日”活动,本期分享核心内容摘要 一、AI任务的需求与DLC 二、KubeDL 三、KubeDLPro 四、总结
1693 0
云原生场景中的 AI任务调度
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI 任务调度|学习笔记
快速学习云原生场景中的 AI 任务调度。
899 0
云原生场景中的 AI 任务调度|学习笔记
|
7天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
136 97
|
12天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
39 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务