阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
大数据开发治理平台 DataWorks,不限时长
简介: 阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能。

在这个数据驱动的时代,如何快速、准确地从海量数据中检索到所需的信息,是所有企业面临的共同挑战。Milvus 作为一款云原生开源向量检索引擎,基于 Faiss、Annoy、HNSW 等知名库构建,并进行了优化,实现了高可用、高性能、易扩展的特性,适用于处理海量向量数据的实时召回。


阿里云向量检索 Milvus 版是阿里云提供的 Serverless Milvus 全托管服务,100% 兼容开源 Milvus,提供高性能、可扩展、大规模 AI 向量数据库相似性检索服务,具备开箱即用、弹性可扩展、全链路监控告警的能力,同时提供开源 Attu 的可视化工具。适用于各种 AI 应用场景,如:多模态搜索、RAG、广告推荐、内容风险识别等。


近日,阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能


立即开通


产品优势

  • 云原生极速向量检索服务

阿里云向量检索 Milvus 版集成了 Vector 检索库,凭借其高性能、高可用性的特点,支持混合查询,为用户提供高效且稳定的向量数据检索能力。


  • 企业级运维及易用性

云上全托管的向量数据库服务,不仅极大地缩减了集群维护成本,而且开箱即用,内置配置管理、安全管理等功能,并通过云原生架构实现高性能、可扩展性,支持按需节点化伸缩能力;同时,还提供了全面可视化的监控告警链路,以确保系统稳定运行及高效运维。


  • 兼容开源 Milvus 生态

阿里云向量检索 Milvus 版全面兼容开源 Milvus 系统,提供了 Attu 等丰富的开源管理工具,更拥有丰富且活跃的生态社区资源。


应用场景

多模态检索

结合 AI 推理、训练等工程平台和 Embedding 模型的能力,Milvus 可高效索引和检索不同类型的数据,如:图片、视频、声纹、办公文档和一些半结构化文档,支持快速精准地跨媒体类型进行信息检索,并提供强大的扩展性和灵活的接口。


智能问答&大模型

Milvus 结合大型语言模型实现智能问答系统,通过向量化处理用户查询,利用其高效检索功能快速匹配“私有知识库”中的信息,并结合大模型,生成准确回应。此方案提供即时、精确、交互式的生成式搜索服务。


公测说明

向量检索Milvus版已开启免费公测,预计于2024年08月30日结束。您可以在向量检索服务Milvus版控制台,进入Milvus页面创建入门版的实例。公测期间您可以免费试用 Milvus 服务,免费试用结束后,您可以续费或及时释放实例,避免产生费用。


*注意 向量检索 Milvus 版实例创建时,需要依赖阿里云OSS产品进行数据存储,相关费用请参见计费概述


公测限制

  • 公测期间,您可以创建实例系列入门版(单机版)或标准版(集群版)的实例。
    当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时((例如,对Milvus集群有使用诉求)),您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。
  • 公测期间不保障服务等级协议 SLA,但服务不降级。
  • 公测期间支持以下地域和可用区。

地域名称

地域ID

可用区

华东1(杭州)

cn-hangzhou

可用区H

可用区J

华东2(上海)

cn-shanghai

可用区G

华北2(北京)

cn-beijing

可用区G

华南1(深圳)

cn-shenzhen

可用区E


操作步骤

  1. 进入阿里云Milvus页面。
  1. 登录阿里云Milvus控制台
  2. 在左侧导航栏,单击Milvus实例
  3. 在顶部菜单栏处,根据实际情况选择地域。
  1. Milvus实例页面,单击创建实例
  2. 在Milvus向量搜索页面,完成相关配置。

配置项

示例

描述

付费类型

包年包月

仅支持包年包月类型。

付费时长

1个月

默认购买时长为1个月,支持的购买时长以实际界面为准。

地域和可用区

华东1(杭州)

可用区J

实例所在的物理位置和可用区。

重要

实例创建后,无法更改地域和可用区,请谨慎选择。

专有网络

vpc_Hangzhou/vpc-bp1f4epmkvncimpgs****

专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络。

选择已有的专有网络,或者如需创建新的专有网络,可以单击前往控制台创建,详情请参见创建和管理专有网络

交换机

vsw_i/vsw-bp1e2f5fhaplp0g6p****

交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。

选择已有的交换机,或者如需创建新的交换机,可以单击控制台创建,详情请参见创建和管理交换机

服务关联角色

AliyunServiceRoleForCloudMilvus

已授予您的阿里云账号的AliyunServiceRoleForCloudMilvus角色,以及与其关联的AliyunServiceRolePolicyForMilvus策略。

Milvus使用此角色来访问您在其他云产品中的资源。

引擎版本

2.4

Milvus的社区版本号。

规格

入门版

Milvus实例的规格。

  • 入门版:适用于测试环境,且资源规格固定。
    选择该规格时,还需配置Standalone规格参数,该参数是入门版节点配置,可以使用默认的4 vCPU 16 GiB。
  • 标准版:适用于生产环境,资源规格可以按需定制。当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时,您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。选择该规格时,还需要配置以下参数:
    • MixCoordinator资源规格:IndexCoord、QueryCoord和DataCoord服务混合部署在该节点上。
    • MixCoordinator节点数量:默认为1,目前不支持HA。
    • Proxy资源规格:指定Proxy节点大小。
    • Proxy节点数量:指定Proxy节点副本数量。
    • Query Node资源规格:指定QueryNode节点大小。
    • Query Node节点数量:指定QueryNode节点副本数量。
    • Index Node资源规格:指定IndexNode节点大小。
    • Index Node节点数量:指定IndexNode节点副本数量。
    • Data Node资源规格:指定DataNode节点大小。
    • Data Node节点数量:指定DataNode节点副本数量。

存储费用

不涉及

您无需预先选择存储容量,存储成本将根据实际的小时使用量进行计费(公测期间免费),使用量将直接显示在实例详情页面。

用户密码

请您自定义

设置Milvus实例的root账号密码以登录数据库。

重要

请牢记您设定的密码,目前无法更改。


  1. 单击立即购买
    当实例状态为运行中时,表示实例创建成功。
  2. 当所有的信息确认正确后,阅读并选中服务协议
  3. 单击去支付,即可开通成功。
    当实例状态为运行中时,表示实例创建成功。


联系我们

如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可加入钉钉群59530004993咨询。


快速跳转

  1. 向量检索 Milvus 版官网:https://www.aliyun.com/product/milvus
  2. 产品控制台:https://milvus.console.aliyun.com/#/overview
  3. 产品文档:https://help.aliyun.com/zh/milvus/
  4. 标准版申请:https://survey.aliyun.com/apps/zhiliao/JqRjGNFoS
相关实践学习
使用ROS创建VPC和VSwitch
本场景主要介绍如何利用阿里云资源编排服务,定义资源编排模板,实现自动化创建阿里云专有网络和交换机。
阿里云专有网络VPC使用教程
专有网络VPC可以帮助您基于阿里云构建出一个隔离的网络环境,并可以自定义IP 地址范围、网段、路由表和网关等;此外,也可以通过专线/VPN/GRE等连接方式实现云上VPC与传统IDC的互联,构建混合云业务。 产品详情:https://www.aliyun.com/product/vpc
相关文章
|
3天前
|
人工智能 缓存 Cloud Native
用 Higress AI 网关降低 AI 调用成本 - 阿里云天池云原生编程挑战赛参赛攻略
《Higress AI 网关挑战赛》正在火热进行中,Higress 社区邀请了目前位于排行榜 top5 的选手杨贝宁同学分享他的心得。本文是他整理的参赛攻略。
136 66
|
3天前
|
机器学习/深度学习 人工智能 算法
解密巴黎奥运会中的阿里云AI技术
2024年巴黎奥运会圆满结束,中国代表团金牌数与美国并列第一,展现了卓越实力。阿里云作为官方云服务合作伙伴,通过先进的AI技术深度融入奥运的各项环节,实现了大规模的云上转播,超越传统卫星转播,为全球观众提供流畅、高清的观赛体验。其中,“子弹时间”回放技术在多个场馆的应用,让观众享受到了电影般的多角度精彩瞬间。此外,8K超高清直播、AI智能解说和通义APP等创新,极大地提升了赛事观赏性和互动性。能耗宝(Energy Expert)的部署则助力实现了赛事的可持续发展目标。巴黎奥运会的成功举办标志着体育赛事正式进入AI时代,开启了体育与科技融合的新篇章。
解密巴黎奥运会中的阿里云AI技术
|
11天前
|
弹性计算 安全 搜索推荐
阿里云通信推出CPaaS解决方案,助力企业数字化体验升级
想要文本短信、多媒体消息等多种通信资源统一管理? 需要创建多个子账号并确保权限隔离? 希望在不同时间节点支持用量弹性伸缩? 欢迎了解阿里云通信【CPaaS通信中台解决方案】~
阿里云通信推出CPaaS解决方案,助力企业数字化体验升级
|
1天前
|
运维 Devops 应用服务中间件
阿里云云效操作报错合集之从企业仓库里拉取依赖报错403,该如何解决
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
阿里云云效操作报错合集之从企业仓库里拉取依赖报错403,该如何解决
|
6天前
|
分布式计算 安全 OLAP
7倍性能提升|阿里云AnalyticDB Spark向量化能力解析
AnalyticDB Spark如何通过向量化引擎提升性能?
|
11天前
|
弹性计算 监控 Devops
"揭秘!阿里云云效如何以戏剧性飞跃,重塑企业门户网站部署,一键解锁DevOps魔法,让您的网站秒变行业巨星!"
【8月更文挑战第8天】阿里云云效企业门户网站部署解决方案是一站式DevOps平台,集成云效Flow、Codeup、Testplan等,支持自动化构建、部署与测试。通过ECS实例等资源准备、云端代码托管、持续集成与部署、及全方位监控,实现网站高效稳定运行。采用YAML配置简化流程,确保快速迭代与优化,适用于各类企业的数字化转型。
35 3
|
13天前
|
人工智能 大数据 云计算
AI时代:企业IT人员的阿里云发展之路
在AI浪潮中,企业IT人员面临挑战与机遇。阿里云作为行业领跑者,提供重要借鉴。IT人员需拥抱持续学习,利用阿里云涵盖云、大数据、AI等全面服务进行自我提升;参与阿里云培训和认证,增强实战经验及交流,紧跟技术趋势与市场动态,从而在AI时代中找准定位,实现职业新突破。
43 5
|
4天前
|
人工智能 网络协议 小程序
重磅升级!阿里云推出首个域名AI大模型应用
重磅升级!阿里云推出首个域名AI大模型应用
22 0
|
4天前
|
人工智能 关系型数据库 分布式数据库
DB+AI会擦出怎样的火花?一站式带你了解阿里云瑶池数据库经典的AI产品服务与实践!
从 DB+AI 精选解决方案、特惠权益等,一站式带你了解阿里云瑶池数据库经典的AI产品服务与实践。
|
5天前
|
人工智能 自然语言处理 IDE
通义灵码 - 免费的阿里云 VS code Jetbrains AI 编码辅助工具(二)
通义灵码 - 免费的阿里云 VS code Jetbrains AI 编码辅助工具
16 0