阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,1000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能。

在这个数据驱动的时代,如何快速、准确地从海量数据中检索到所需的信息,是所有企业面临的共同挑战。Milvus 作为一款云原生开源向量检索引擎,基于 Faiss、Annoy、HNSW 等知名库构建,并进行了优化,实现了高可用、高性能、易扩展的特性,适用于处理海量向量数据的实时召回。


阿里云向量检索 Milvus 版是阿里云提供的 Serverless Milvus 全托管服务,100% 兼容开源 Milvus,提供高性能、可扩展、大规模 AI 向量数据库相似性检索服务,具备开箱即用、弹性可扩展、全链路监控告警的能力,同时提供开源 Attu 的可视化工具。适用于各种 AI 应用场景,如:多模态搜索、RAG、广告推荐、内容风险识别等。


近日,阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能


立即开通


产品优势

  • 云原生极速向量检索服务

阿里云向量检索 Milvus 版集成了 Vector 检索库,凭借其高性能、高可用性的特点,支持混合查询,为用户提供高效且稳定的向量数据检索能力。


  • 企业级运维及易用性

云上全托管的向量数据库服务,不仅极大地缩减了集群维护成本,而且开箱即用,内置配置管理、安全管理等功能,并通过云原生架构实现高性能、可扩展性,支持按需节点化伸缩能力;同时,还提供了全面可视化的监控告警链路,以确保系统稳定运行及高效运维。


  • 兼容开源 Milvus 生态

阿里云向量检索 Milvus 版全面兼容开源 Milvus 系统,提供了 Attu 等丰富的开源管理工具,更拥有丰富且活跃的生态社区资源。


应用场景

多模态检索

结合 AI 推理、训练等工程平台和 Embedding 模型的能力,Milvus 可高效索引和检索不同类型的数据,如:图片、视频、声纹、办公文档和一些半结构化文档,支持快速精准地跨媒体类型进行信息检索,并提供强大的扩展性和灵活的接口。


智能问答&大模型

Milvus 结合大型语言模型实现智能问答系统,通过向量化处理用户查询,利用其高效检索功能快速匹配“私有知识库”中的信息,并结合大模型,生成准确回应。此方案提供即时、精确、交互式的生成式搜索服务。


公测说明

向量检索Milvus版已开启免费公测,预计于2024年08月30日结束。您可以在向量检索服务Milvus版控制台,进入Milvus页面创建入门版的实例。公测期间您可以免费试用 Milvus 服务,免费试用结束后,您可以续费或及时释放实例,避免产生费用。


*注意 向量检索 Milvus 版实例创建时,需要依赖阿里云OSS产品进行数据存储,相关费用请参见计费概述


公测限制

  • 公测期间,您可以创建实例系列入门版(单机版)或标准版(集群版)的实例。
    当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时((例如,对Milvus集群有使用诉求)),您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。
  • 公测期间不保障服务等级协议 SLA,但服务不降级。
  • 公测期间支持以下地域和可用区。

地域名称

地域ID

可用区

华东1(杭州)

cn-hangzhou

可用区H

可用区J

华东2(上海)

cn-shanghai

可用区G

华北2(北京)

cn-beijing

可用区G

华南1(深圳)

cn-shenzhen

可用区E


操作步骤

  1. 进入阿里云Milvus页面。
  1. 登录阿里云Milvus控制台
  2. 在左侧导航栏,单击Milvus实例
  3. 在顶部菜单栏处,根据实际情况选择地域。
  1. Milvus实例页面,单击创建实例
  2. 在Milvus向量搜索页面,完成相关配置。

配置项

示例

描述

付费类型

包年包月

仅支持包年包月类型。

付费时长

1个月

默认购买时长为1个月,支持的购买时长以实际界面为准。

地域和可用区

华东1(杭州)

可用区J

实例所在的物理位置和可用区。

重要

实例创建后,无法更改地域和可用区,请谨慎选择。

专有网络

vpc_Hangzhou/vpc-bp1f4epmkvncimpgs****

专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络。

选择已有的专有网络,或者如需创建新的专有网络,可以单击前往控制台创建,详情请参见创建和管理专有网络

交换机

vsw_i/vsw-bp1e2f5fhaplp0g6p****

交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。

选择已有的交换机,或者如需创建新的交换机,可以单击控制台创建,详情请参见创建和管理交换机

服务关联角色

AliyunServiceRoleForCloudMilvus

已授予您的阿里云账号的AliyunServiceRoleForCloudMilvus角色,以及与其关联的AliyunServiceRolePolicyForMilvus策略。

Milvus使用此角色来访问您在其他云产品中的资源。

引擎版本

2.4

Milvus的社区版本号。

规格

入门版

Milvus实例的规格。

  • 入门版:适用于测试环境,且资源规格固定。
    选择该规格时,还需配置Standalone规格参数,该参数是入门版节点配置,可以使用默认的4 vCPU 16 GiB。
  • 标准版:适用于生产环境,资源规格可以按需定制。当您的向量数据规模超过500万,或者当前入门版的规格无法满足您的业务需求时,您可以填写阿里云向量检索Milvus标准版测试申请表申请试用。相较于入门版本,Milvus标准版提供了更大范围的实例规格选项和更加多样化的配置,您可以根据实际使用情况灵活选择最适合的实例规格。选择该规格时,还需要配置以下参数:
    • MixCoordinator资源规格:IndexCoord、QueryCoord和DataCoord服务混合部署在该节点上。
    • MixCoordinator节点数量:默认为1,目前不支持HA。
    • Proxy资源规格:指定Proxy节点大小。
    • Proxy节点数量:指定Proxy节点副本数量。
    • Query Node资源规格:指定QueryNode节点大小。
    • Query Node节点数量:指定QueryNode节点副本数量。
    • Index Node资源规格:指定IndexNode节点大小。
    • Index Node节点数量:指定IndexNode节点副本数量。
    • Data Node资源规格:指定DataNode节点大小。
    • Data Node节点数量:指定DataNode节点副本数量。

存储费用

不涉及

您无需预先选择存储容量,存储成本将根据实际的小时使用量进行计费(公测期间免费),使用量将直接显示在实例详情页面。

用户密码

请您自定义

设置Milvus实例的root账号密码以登录数据库。

重要

请牢记您设定的密码,目前无法更改。


  1. 单击立即购买
    当实例状态为运行中时,表示实例创建成功。
  2. 当所有的信息确认正确后,阅读并选中服务协议
  3. 单击去支付,即可开通成功。
    当实例状态为运行中时,表示实例创建成功。


联系我们

如果您在使用向量检索 Milvus 版的过程中遇到任何疑问,可加入钉钉群59530004993咨询。


快速跳转

  1. 向量检索 Milvus 版官网:https://www.aliyun.com/product/milvus
  2. 产品控制台:https://milvus.console.aliyun.com/#/overview
  3. 产品文档:https://help.aliyun.com/zh/milvus/
  4. 标准版申请:https://survey.aliyun.com/apps/zhiliao/JqRjGNFoS
相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
7天前
|
人工智能 安全 网络安全
|
7天前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
|
12天前
|
人工智能 安全 搜索推荐
面向阿里云百炼用户的AI安全护栏服务
本服务专为百炼平台用户提供,旨在提升大模型的文字输入和输出安全审核体验。在遵守百炼平台红线管控政策的基础上,我们提供了灵活的审核标签管理功能,允许用户根据需要开启或关闭特定审核标签。此外,我们还提供定制化的安全策略配置服务,以满足不同用户的个性化需求。
64 0
|
13天前
|
人工智能 数据可视化 前端开发
AI Ping:精准可靠的大模型服务性能评测平台
AI Ping是清华系团队推出的“大模型服务评测平台”,被誉为“AI界的大众点评”。汇聚230+模型服务,7×24小时监测性能数据,以吞吐量、延迟等硬指标助力开发者科学选型。界面简洁,数据可视化强,支持多模型对比,横向对标国内外主流平台,为AI应用落地提供权威参考。
172 3
|
机器学习/深度学习 人工智能 计算机视觉
AI医疗开创性研究:深度学习进行病变检索和匹配(31 PPT)
美国国立卫生研究院(NIH)的研究人员通过创建基于真实放射学影像的大型数据集,进行病变检索和匹配的研究。本文是相关研究在约翰霍普金斯大学 Sol Goldman国际会议上的演讲整理,该研究具有创新性的科学价值和临床价值。
2601 0
|
7天前
|
边缘计算 人工智能 算法
AI在智慧能源管理中的边缘计算应用
AI在智慧能源管理中的边缘计算应用
71 13
|
7天前
|
人工智能 Cloud Native 中间件
划重点|云栖大会「AI 原生应用架构论坛」看点梳理
本场论坛将系统性阐述 AI 原生应用架构的新范式、演进趋势与技术突破,并分享来自真实生产环境下的一线实践经验与思考。
|
7天前
|
存储 人工智能 Serverless
函数计算进化之路:AI 应用运行时的状态剖析
AI应用正从“请求-响应”迈向“对话式智能体”,推动Serverless架构向“会话原生”演进。阿里云函数计算引领云上 AI 应用 Serverless 运行时技术创新,实现性能、隔离与成本平衡,开启Serverless AI新范式。
170 13
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。

热门文章

最新文章