阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

简介: 阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

在这个数据驱动的时代,如何快速、准确地从海量数据中检索到所需的信息,是所有企业面临的共同挑战。Milvus  作为一款云原生开源向量检索引擎,基于 Faiss、Annoy、HNSW  等知名库构建,并进行了优化,实现了高可用、高性能、易扩展的特性,适用于处理海量向量数据的实时召回。


阿里云向量检索  Milvus 版是阿里云提供的 Serverless Milvus 全托管服务,100% 兼容开源 Milvus,提供高性能、可扩展、大规模  AI 向量数据库相似性检索服务,具备开箱即用、弹性可扩展、全链路监控告警的能力,同时提供开源 Attu 的可视化工具。适用于各种 AI  应用场景,如:多模态搜索、RAG、广告推荐、内容风险识别等。


近日,阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能。


产品优势

  • 云原生极速向量检索服务

阿里云向量检索 Milvus 版集成了 Vector 检索库,凭借其高性能、高可用性的特点,支持混合查询,为用户提供高效且稳定的向量数据检索能力。

  • 企业级运维及易用性

云上全托管的向量数据库服务,不仅极大地缩减了集群维护成本,而且开箱即用,内置配置管理、安全管理等功能,并通过云原生架构实现高性能、可扩展性,支持按需节点化伸缩能力;同时,还提供了全面可视化的监控告警链路,以确保系统稳定运行及高效运维。

  • 兼容开源 Milvus 生态

阿里云向量检索 Milvus 版全面兼容开源 Milvus 系统,提供了 Attu 等丰富的开源管理工具,更拥有丰富且活跃的生态社区资源。


应用场景

多模态检索


结合 AI 推理、训练等工程平台和 Embedding 模型的能力,Milvus 可高效索引和检索不同类型的数据,如:图片、视频、声纹、办公文档和一些半结构化文档,支持快速精准地跨媒体类型进行信息检索,并提供强大的扩展性和灵活的接口。

image.png

智能问答&大模型


Milvus 结合大型语言模型实现智能问答系统,通过向量化处理用户查询,利用其高效检索功能快速匹配“私有知识库”中的信息,并结合大模型,生成准确回应。此方案提供即时、精确、交互式的生成式搜索服务。

image.png

公测说明

阿里云向量检索 Milvus 版已开启免费公测。您可以在E-MapReduce控制台,选择 EMR Serverless > Milvus,进入 Milvus 页面创建入门版的实例。公测期间您可以免费试用 Milvus 服务,免费试用结束后,您可以续费或及时释放实例,避免产生费用。


https://emr-next.console.aliyun.com/


*注意 向量检索 Milvus 版实例创建时,需要依赖阿里云OSS产品进行数据存储,相关费用请参见计费概述


https://help.aliyun.com/zh/oss/product-overview/billing-overview

公测限制

  • 公测期间,您仅可以创建实例系列入门版的实例,且限创建3个。


当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时,您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus 标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。

https://survey.aliyun.com/apps/zhiliao/JqRjGNFoS


  • 公测期间不保障服务等级协议 SLA,但服务不降级。
  • 公测期间支持以下地域和可用区。

地域名称

地域ID

可用区

华东1(杭州)

cn-hangzhou

可用区H

可用区J

华东2(上海)

cn-shanghai

可用区G

华北2(北京)

cn-beijing

可用区G

操作步骤

  1. 进入 EMR Serverless Milvus 页面。
    https://emr-next.console.aliyun.com/

  1. 登录E-MapReduce控制台
  2. 在左侧导航栏,选择EMR Serverless > Milvus
  3. 在顶部菜单栏处,根据实际情况选择地域。
  1. Milvus页面,单击创建实例

image.png

  1. 在Milvus向量搜索页面,完成相关配置。

配置项

示例

描述

付费类型

包年包月

仅支持包年包月类型。

付费时长

1个月

默认购买时长为1个月,支持的购买时长以实际界面为准。

地域和可用区

华东1(杭州)

可用区H

实例所在的物理位置和可用区。

*注意 实例创建后,无法更改地域和可用区,请谨慎选择。

VPC ID

vpc_Hangzhou/vpc-bp1f4epmkvncimpgs****

专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络。

选择已有的专有网络,或者如需创建新的专有网络,可以单击前往控制台创建,详情请参见创建和管理专有网络

vSwitch ID

vsw_i/vsw-bp1e2f5fhaplp0g6p****

交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。

选择已有的交换机,或者如需创建新的交换机,可以单击控制台创建,详情请参见创建和管理交换机

服务关联角色

AliyunServiceRoleForMilvus

已授予您的阿里云账号的AliyunServiceRoleForMilvus角色,以及与其关联的AliyunServiceRolePolicyForMilvus策略。

Milvus使用此角色来访问您在其他云产品中的资源。

引擎版本

2.3

Milvus的社区版本号。

OSS存储

serverless-milvus-oss

用于存储向量数据。

*注意 需为Bucket创建指定标签,key为Product,value为ServerlessMilvus,详情请参见管理存储空间标签

如果没有Bucket,在OSS存储下拉列表中选择去创建,跳转至对象存储OSS控制台上创建,具体操作请参见控制台创建存储空间

规格

入门版

Milvus实例的规格。

  • 入门版:适用于测试环境,且资源规格固定。

选择该规格时,还需配置Standalone规格参数,该参数是入门版节点配置,可以使用默认的1 vCPU 4 GiB。

  • 标准版:适用于生产环境,资源规格可以按需定制。

root用户密码

请您自定义

设置Milvus实例用于登录数据库的root账号密码。

重要

请牢记您设定的密码,目前不支持修改密码。

image.png

  1. 单击立即购买

当实例状态为运行中时,表示实例创建成功。

联系我们

如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可加入钉钉群咨询。

快速跳转

  • 向量检索 Milvus 版官网:

https://www.aliyun.com/product/bigdata/emapreduce/milvus

  • 产品控制台:

https://emr-next.console.aliyun.com/

  • 产品文档:

https://help.aliyun.com/zh/emr/serverless-milvus/

  • 标准版申请:

https://survey.aliyun.com/apps/zhiliao/JqRjGNFoS

/ END /

相关文章
|
4月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3035 166
|
4月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
4月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
705 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
4月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
993 50
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1157 53
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
581 30
|
4月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
562 1
|
4月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
4月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
352 3