阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

简介: 阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能。

在这个数据驱动的时代,如何快速、准确地从海量数据中检索到所需的信息,是所有企业面临的共同挑战。Milvus 作为一款云原生开源向量检索引擎,基于 Faiss、Annoy、HNSW 等知名库构建,并进行了优化,实现了高可用、高性能、易扩展的特性,适用于处理海量向量数据的实时召回。


阿里云向量检索 Milvus 版是阿里云提供的 Serverless Milvus 全托管服务,100% 兼容开源 Milvus,提供高性能、可扩展、大规模 AI 向量数据库相似性检索服务,具备开箱即用、弹性可扩展、全链路监控告警的能力,同时提供开源 Attu 的可视化工具。适用于各种 AI 应用场景,如:多模态搜索、RAG、广告推荐、内容风险识别等。


近日,阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能


立即开通


产品优势

  • 云原生极速向量检索服务

阿里云向量检索 Milvus 版集成了 Vector 检索库,凭借其高性能、高可用性的特点,支持混合查询,为用户提供高效且稳定的向量数据检索能力。


  • 企业级运维及易用性

云上全托管的向量数据库服务,不仅极大地缩减了集群维护成本,而且开箱即用,内置配置管理、安全管理等功能,并通过云原生架构实现高性能、可扩展性,支持按需节点化伸缩能力;同时,还提供了全面可视化的监控告警链路,以确保系统稳定运行及高效运维。


  • 兼容开源 Milvus 生态

阿里云向量检索 Milvus 版全面兼容开源 Milvus 系统,提供了 Attu 等丰富的开源管理工具,更拥有丰富且活跃的生态社区资源。


应用场景

多模态检索

结合 AI 推理、训练等工程平台和 Embedding 模型的能力,Milvus 可高效索引和检索不同类型的数据,如:图片、视频、声纹、办公文档和一些半结构化文档,支持快速精准地跨媒体类型进行信息检索,并提供强大的扩展性和灵活的接口。


智能问答&大模型

Milvus 结合大型语言模型实现智能问答系统,通过向量化处理用户查询,利用其高效检索功能快速匹配“私有知识库”中的信息,并结合大模型,生成准确回应。此方案提供即时、精确、交互式的生成式搜索服务。


公测说明

向量检索Milvus版已开启免费公测,预计于2024年08月30日结束。您可以在向量检索服务Milvus版控制台,进入Milvus页面创建入门版的实例。公测期间您可以免费试用 Milvus 服务,免费试用结束后,您可以续费或及时释放实例,避免产生费用。


*注意 向量检索 Milvus 版实例创建时,需要依赖阿里云OSS产品进行数据存储,相关费用请参见计费概述


公测限制

  • 公测期间,您可以创建实例系列入门版(单机版)或标准版(集群版)的实例。
    当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时((例如,对Milvus集群有使用诉求)),您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。
  • 公测期间不保障服务等级协议 SLA,但服务不降级。
  • 公测期间支持以下地域和可用区。

地域名称

地域ID

可用区

华东1(杭州)

cn-hangzhou

可用区H

可用区J

华东2(上海)

cn-shanghai

可用区G

华北2(北京)

cn-beijing

可用区G

华南1(深圳)

cn-shenzhen

可用区E


操作步骤

  1. 进入阿里云Milvus页面。
  1. 登录阿里云Milvus控制台
  2. 在左侧导航栏,单击Milvus实例
  3. 在顶部菜单栏处,根据实际情况选择地域。
  1. Milvus实例页面,单击创建实例
  2. 在Milvus向量搜索页面,完成相关配置。

配置项

示例

描述

付费类型

包年包月

仅支持包年包月类型。

付费时长

1个月

默认购买时长为1个月,支持的购买时长以实际界面为准。

地域和可用区

华东1(杭州)

可用区J

实例所在的物理位置和可用区。

重要

实例创建后,无法更改地域和可用区,请谨慎选择。

专有网络

vpc_Hangzhou/vpc-bp1f4epmkvncimpgs****

专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络。

选择已有的专有网络,或者如需创建新的专有网络,可以单击前往控制台创建,详情请参见创建和管理专有网络

交换机

vsw_i/vsw-bp1e2f5fhaplp0g6p****

交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。

选择已有的交换机,或者如需创建新的交换机,可以单击控制台创建,详情请参见创建和管理交换机

服务关联角色

AliyunServiceRoleForCloudMilvus

已授予您的阿里云账号的AliyunServiceRoleForCloudMilvus角色,以及与其关联的AliyunServiceRolePolicyForMilvus策略。

Milvus使用此角色来访问您在其他云产品中的资源。

引擎版本

2.4

Milvus的社区版本号。

规格

入门版

Milvus实例的规格。

  • 入门版:适用于测试环境,且资源规格固定。
    选择该规格时,还需配置Standalone规格参数,该参数是入门版节点配置,可以使用默认的4 vCPU 16 GiB。
  • 标准版:适用于生产环境,资源规格可以按需定制。当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时,您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。选择该规格时,还需要配置以下参数:
    • MixCoordinator资源规格:IndexCoord、QueryCoord和DataCoord服务混合部署在该节点上。
    • MixCoordinator节点数量:默认为1,目前不支持HA。
    • Proxy资源规格:指定Proxy节点大小。
    • Proxy节点数量:指定Proxy节点副本数量。
    • Query Node资源规格:指定QueryNode节点大小。
    • Query Node节点数量:指定QueryNode节点副本数量。
    • Index Node资源规格:指定IndexNode节点大小。
    • Index Node节点数量:指定IndexNode节点副本数量。
    • Data Node资源规格:指定DataNode节点大小。
    • Data Node节点数量:指定DataNode节点副本数量。

存储费用

不涉及

您无需预先选择存储容量,存储成本将根据实际的小时使用量进行计费(公测期间免费),使用量将直接显示在实例详情页面。

用户密码

请您自定义

设置Milvus实例的root账号密码以登录数据库。

重要

请牢记您设定的密码,目前无法更改。


  1. 单击立即购买
    当实例状态为运行中时,表示实例创建成功。
  2. 当所有的信息确认正确后,阅读并选中服务协议
  3. 单击去支付,即可开通成功。
    当实例状态为运行中时,表示实例创建成功。


联系我们

如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可加入钉钉群59530004993咨询。


快速跳转

  1. 向量检索 Milvus 版官网:https://www.aliyun.com/product/milvus
  2. 产品控制台:https://milvus.console.aliyun.com/#/overview
  3. 产品文档:https://help.aliyun.com/zh/milvus/
  4. 标准版申请:https://survey.aliyun.com/apps/zhiliao/JqRjGNFoS
相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
3月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
2958 166
|
3月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
3月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
3月前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
AI效果图竟能拿到融资!这家建筑AI企业4个月融了两轮,扎哈高管也去做顾问
累计融资610万欧元,从效果图场景切入的AI企业Gendo三阶段进化。
151 5
|
3月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
646 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
3月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
3月前
|
人工智能 算法 搜索推荐
AI 搜索时代选 GEO 外援?十家服务商,企业看过来
随着AI普及,GEO(生成式引擎优化)成为品牌获客新赛道。本文推荐10家优质GEO服务商,涵盖内容优化、流量提升、合规风控等方向,助力企业提升在DeepSeek、豆包等AI模型中的曝光与推荐,实现智能时代的精准增长。
|
3月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
887 48
|
3月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
544 30

热门文章

最新文章