方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
简介: 阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。

引言:当数据洪流遇上秒级决策


凌晨1点,某电商平台的推荐系统突然告急——每秒涌入的10万次用户点击,让原本精准的搜索推荐陷入混乱。商品库中上亿张图片和描述文本,如何在毫秒内找到与用户行为最匹配的商品?另一边,一家汽车公司的自动驾驶团队正为如何用千万份单日PB级的仿真驾驶多模态数据的预训练发愁;同时还有更多企业在思考如何进一步提高智能客服回答问题的准确度并给用户提供相应参考信息。


这些场景背后,是一个共同的挑战:多模态数据的处理效率,正成为企业智能化转型的关键。

现在,百炼+向量检索服务Milvus版这对组合为多模态数据的处理和利用提供了高效的解决方案。


方案背景

阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。不论是开发者还是业务人员,都能深入参与大模型应用的设计和构建。您可以通过简单的界面操作,在5分钟内开发出一款大模型应用,或在几小时内训练出一个专属模型,从而将更多精力专注于应用创新。


其中,在生成式AI场景中(如大模型训练、知识库构建等),百炼平台可提供多款向量模型,如通用多模态向量、通用文本向量等,能够根据用户的输入生成高维连续向量,这些输入可以是文本、图片或视频。多模态向量在可应用于图片搜索、文搜图、视频搜索、图片分类和视频内容审核等下游任务中。


image.png


那么这些生成的向量数据需要:

  • 高效存储:支持海量向量持久化存储
  • 快速检索:实现毫秒级相似性搜索
  • 灵活扩展:适应业务快速增长的数据规模


阿里云向量检索服务Milvus版(简称阿里云Milvus)作为云原生向量数据库,能完美匹配以上需求。用户可以调用百炼的Embedding向量模型API将文本图片、视频等其他多模态数据转换为向量,并将这些向量数据存入阿里云Milvus的向量数据库中进行检索。


简而言之,阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。


方案介绍

方案描述

用户核心痛点:

  • 多模态数据处理挑战
  • 文本、图像等高维数据难以直接用于AI计算,传统关系型数据库无法高效存储和检索向量
  • 自建向量检索系统成本高(硬件投入超百万/年)、性能差(亿级数据查询延迟>1秒)
  • 规模化扩展瓶颈
  • 数据量激增导致存储扩容困难,传统方案需停机分片
  • 多模态混合检索(文本+图像+视频)缺乏统一技术栈支持
  • 业务连续性风险
  • 开源向量数据库运维复杂,故障恢复耗时(RTO>30分钟)
  • 缺乏企业级数据安全保护(传输/存储加密、权限管控)


本方案构建了一套从多模态数据向量化到高效检索的完整链路:通过百炼平台的多模态AI向量模型生成高维向量数据,并借助阿里云Milvus向量数据库实现海量向量的存储、索引与毫秒级检索。方案覆盖数据预处理、向量生成、分布式存储、混合检索等全流程,为AI场景提供开箱即用的向量数据管理能力,支撑推荐系统、内容相似性搜索等业务场景的快速落地。

image.png


实现步骤(以文本数据为例):

资源准备:


请确保您的运行环境中已安装Python 3.8或以上版本,以便顺利安装并使用DashScope。

  1. 准备输入数据借助LangChain SDK对文本进行分割,作为Embedding向量模型的输入数据。
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1024, chunk_overlap=0)
# 使用LangChain将输入文档安照chunk_size切分
all_splits = text_splitter.split_documents(docs)
  1. 创建Milvus集合Collection用于存储和管理向量数据
# 设置Milvus Collection名称。
COLLECTION_NAME = 'doc_qa_db'
# 设置向量维度。
DIMENSION = 768
  1. 选定的Embedding模型(DashScope)负责将输入文本转换为向量,并将这些向量存入阿里云Milvus的向量数据库中。
# 设置embedding模型为DashScope(可以替换成自己模型)。
embeddings = DashScopeEmbeddings(
    model="text-embedding-v2", dashscope_api_key="your_api_key"
)
# 创建connection,host为阿里云Milvus的访问域名。
connection_args = {"host": "c-xxxx.milvus.aliyuncs.com", "port": "19530", "user": "your_user", "password": "your_password"}
# 创建Collection
vector_store = Milvus(
    embedding_function=embeddings,
    connection_args=connection_args,
    collection_name=COLLECTION_NAME,
    drop_old=True,
).from_documents(
    all_splits,
    embedding=embeddings,
    collection_name=COLLECTION_NAME,
    connection_args=connection_args,
)
  1. 向量相似性检索:Embedding模型处理查询输入,并将其向量化。
# 利用Milvus向量数据库进行相似性检索。
query = "What are the main components of Milvus?"
docs = vector_store.similarity_search(query)
print(len(docs))


方案特点

  • 架构角度
  • 全托管云原生服务,无缝对接,开箱即用,入门门槛低
  • 阿里云Milvus作为AI专业向量检索引擎,支持超大规模向量数据处理
  • 性能角度
  • 检索秒级响应
  • 支持跨模态混合检索,兼顾召回率和精确度
  • 成本角度(和自建相比)
  • 无需预先购买GPU等硬件成本
  • 百炼和阿里云Milvus均可全托管,运维0成本
  • 分布式架构存储千亿级别向量数据,存储效率提升


应用场景

阿里云Milvus存储百炼产生的向量数据并进行检索的产品组合方案,可广泛并灵活运用于以下典型场景:

  • 多模态数据搜索与推荐:
  • 电商或零售跨模态商品搜索:用户通过上传图片搜索相似商品
  • 医疗影像检索:输入CT或B超等影响,检索相似病例及治疗方案
  • 文化媒体内容搜索:“听一听”识曲等
  • 搭建基于RAG的智能问答系统
  • 智能客服:通过问答机器人自动回复用户问题,降低人工成本
  • 法律咨询服务:精准匹配法律条例和判例,生成法律意见书草案等
  • 电商导购:根据用户提出的需求自动推荐相关商品
  • 企业知识管理:员工可通过自然语言提问,直接获取跨系统文档中的关键信息
  • 自动驾驶
  • 自动驾驶数据预训练


立即体验

如果您想体验阿里云Milvus的相关能力,欢迎在阿里云官网搜索向量检索服务Milvus版进行体验。

产品新用户也可免费领取1个月试用资格

此外,阿里云为了回馈新老用户,推出了重大优惠

阿里云向量检索服务 Milvus 版  限时年付5折! 新购续费均可|每个uid仅限参与1次(非同人)购买地址



目录
打赏
0
0
0
0
109
分享
相关文章
基于百炼平台qwen-max的api 打造一套 检索增强 图谱增强 智能工具调用决策的智能体
本文介绍了一种基于阿里云百炼平台的`qwen-max` API构建的智能体方案,该方案集成了检索增强、图谱增强及智能工具调用决策三大模块,旨在通过结合外部数据源、知识图谱和自动化决策提高智能回答的准确性和丰富度。通过具体代码示例展示了如何实现这些功能,最终形成一个能灵活应对多种查询需求的智能系统。
366 11
基于百炼平台qwen-max的api 打造一套 检索增强 图谱增强 基于指令的智能工具调用决策 智能体
基于百炼平台的 `qwen-max` API,设计了一套融合检索增强、图谱增强及指令驱动的智能工具调用决策系统。该系统通过解析用户指令,智能选择调用检索、图谱推理或模型生成等工具,以提高问题回答的准确性和丰富性。系统设计包括指令解析、工具调用决策、检索增强、图谱增强等模块,旨在通过多种技术手段综合提升智能体的能力。
366 5
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
随着大模型的越来越盛行,现在很多企业开始接入大模型的接口,今天我从java开发角度来写一个demo的示例,用于接入DeepSeek大模型,国内的大模型有很多的接入渠道,今天主要介绍下阿里云的百炼模型,因为这个模型是免费的,只要注册一个账户,就会免费送百万的token进行学习,今天就从一个简单的可以执行的示例开始进行介绍,希望可以分享给各位正在学习的同学们。
133 3
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
让RAG更聪明,ViDoRAG开启视觉文档检索增强生成新范式,上阿里云百炼可直接体验
视觉丰富文档的高效检索与生成是自然语言处理领域的重大挑战。ViDoRAG(Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents)由阿里巴巴通义实验室、中国科学技术大学和上海交通大学联合提出,通过多智能体框架和动态迭代推理机制解决此问题。其核心包括多模态混合检索策略和多智能体生成流程,同时发布的ViDoSeek数据集,专为大规模文档集合设计,提供复杂推理与精准问答的评估基准。实验表明,ViDoRAG在准确率和效率上优于传统方法,未来将优化系统性能并降低计算成本。
阿里云出手了,基于百炼一键部署DeepSeek满血版,告别服务器繁忙1
阿里云百炼平台推出一键部署DeepSeek-R1满血版671B模型,提供100万免费Token,无需编码,新手5分钟内即可完成部署。通过Chatbox客户端配置API,轻松实现模型调用,解决服务器繁忙问题,支持自动弹性扩展,降低硬件成本。详情及教程见阿里云百炼官网。
376 5
云端问道10期方案教学-百炼融合AnalyticDB,10分钟创建网站AI助手
本次分享由阿里云产品经理陈茏久介绍,主题为“百炼融合 AnalyticDB,10 分钟创建网站 AI 助手”。内容涵盖五个部分:大模型带来的行业变革、向量数据库驱动的 RAG 服务化探索、方案及优势与典型场景应用案例、产品选型配置介绍以及最新发布。重点探讨了大模型在各行业的应用,AnalyticDB 的独特优势及其在构建企业级知识库和增强检索服务中的作用。通过结合通义千问等产品,展示了如何在短时间内创建一个高效的网站 AI 助手,帮助企业快速实现智能化转型。
云端问道11期方案教学-创建专属AI助手-阿里云百炼产品能力分享
阿里云百炼产品能力分享旨在帮助用户深入了解百炼的核心功能,并快速将大模型与系统结合。主要内容包括:1. 百炼的产品定位和能力简介,涵盖模型推理、应用搭建等;2. 知识检索RAG智能体的应用能力和优势,介绍其高效构建知识库的步骤及常见问题;3. 最佳落地案例实践,如宠物行业AI助手和产业分析类互联网企业的Copilot机器人。通过这些内容,用户可以全面掌握百炼在实际业务中的应用方法和效果。
115 0
基于百炼 qwen plus 、开源qwen2.5 7B Instruct 建非schema限定的图谱 用于agent tool的图谱形式结构化 文本资料方案
基于百炼 qwen plus 的上市企业ESG图谱构建工作,通过调用阿里云的 OpenAI 服务,从 Excel 文件读取上市公司 ESG 报告数据,逐条处理并生成知识图谱,最终以 YAML 格式输出。该过程包括数据读取、API 调用、结果处理和文件保存等步骤,确保生成的知识图谱全面、动态且结构清晰。此外,还提供了基于 Pyvis 的可视化工具,将生成的图谱以交互式图形展示,便于进一步分析和应用。
583 3
阿里云百炼知识检索应用评测:构建智能问答助手【开发者评测|阿里云百炼】
阿里云百炼是基于大模型的一站式开发平台,支持快速构建智能问答助手。评测中,通过上传企业数据创建知识库,并配置应用参数如温度系数、最长回复长度等,最终通过API实现问答功能。实操难点包括数据上传限制及参数配置复杂度。建议增加上传灵活性、提供更多配置指南和功能扩展插件。总体而言,阿里云百炼提供了强大且灵活的工具,有助于高效开发大模型应用。
2494 6
【自定义插件系列】0基础在阿里云百炼上玩转大模型自定义插件
本文介绍了如何在阿里云百炼平台上创建大模型自定义插件,以增强AI模型功能或适配特定需求。通过编程接口(API)或框架设计外部扩展模块,开发者可在不修改底层参数的情况下扩展模型能力。文章以万相文生图V2版模型为例,详细说明了创建自定义插件的五个步骤:新建插件、创建工具、测试工具、复制第二个工具及最终测试发布。同时,提供了官方文档参考链接和具体参数设置指导,帮助用户轻松实现插件开发与应用,推动AI技术在各行业的广泛应用。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等