搜索 ≠ 简单匹配!0代码实现语义级图文互搜

简介: 在非结构化数据爆发增长的背景下,传统图文检索方式已难以满足企业对高效、精准搜索的需求。本方案介绍如何借助阿里云 Milvus 实现高效的多模态图文检索,适用于电商、政务、媒体等多个场景。方案具备开箱即用、性能强劲、高可用及安全防护等优势,结合百炼模型服务与函数计算,助力企业快速构建智能搜索系统,降低运维成本,提升业务创新能力。

在图像、文本、视频等非结构化数据爆发增长的今天,传统的图文检索方式已难以满足企业对高效、精准、可扩展的搜索需求。越来越多的应用开始支持“输入一段文字,找到最匹配的图片”或“上传一张图,找出视觉最相似的内容”。这些看似简单的功能背后,其实隐藏着不小的技术挑战。比如:如何快速从上百万张图片中找到最相似的?如何保证检索系统的扩展性和稳定性?如何降低开发和运维成本?


本方案将介绍借助阿里云 Milvus 轻松实现高效的多模态图文检索,覆盖电商、政务、媒体、法律、医疗等多个典型业务场景。


方案优势

阿里云 Milvus 是一款全托管向量检索引擎,它在开源版本的基础上增强了可扩展性,能提供大规模 Al 向量数据的相似性检索服务,凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,成为多样化 Al 应用场景的理想选择,包括多模态搜索、检索增强生成 (RAG)、搜索推荐、内容风险识别等。


开箱即用

全托管开箱即用,分钟级拉起集群,支持弹性扩缩容与平滑版本升级,提供100+监控指标和自定义报警,运维更轻松高效。


性能更强

通过内核与配置优化,提供更强大的 ANN 算法、稀疏查询算法等能力,提升集群读写、向量检索等多项性能。


高可用,可视化运维

数据服务可靠性 99.9%,提供可视化管理数据能力,组件服务多副本,数据多副本,具备更高可用性。

原生安全,多层防护

支持 HTTP 加密传输与数据存储加密,基于 VPC 网络隔离和 RAM 访问控制,结合 RBAC 认证机制,构建多层次安全体系,保障数据访问安全与高可用。


方案架构

基于阿里云向量检索服务 Milvus 版,结合阿里云百炼模型服务的多模态语义理解能力,构建高效、灵活的搜索系统,轻松支持文搜图、图搜图、跨模态检索等典型应用。通过 Serverless AI 应用开发平台 Function AI 部署至函数计算,可将模型服务一键部署至函数计算,实现快速上线、自动扩缩容与全托管运维,显著降低部署与运营成本,助力企业聚焦核心业务创新。


方案部署

1. 创建云资源

a. 获取百炼API-KEY:访问阿里云百炼大模型服务平台[1],获取并复制 API-Key。

b. 创建专有网络VPC和交换机:访问专有网络管理控制台[2],单击专有网络,选择 华东1(杭州)地域,并创建专有网络。在配置交换机时,可参考配置数据如下:

c. 创建阿里云向量检索服务 Milvus 版实例:

i. 访问 阿里云 Milvus 管理控制台[3],选择 华东1(杭州)地域并单击实例创建,可参考配置默认值如下:

ii. 创建数据库:在阿里云 Milvus 管理控制台[3]的左侧导航栏,单击Milvus 实例,待实例状态变为运行中后,在实例详情页,单击单击安全配置页签,单击开启公网,在弹出的窗口中配置公网访问名单。在 Attu 管理页面,进入数据库管理页面,单击+创建数据库,在弹出的对话框中,输入数据库名称test_db,单击创建。

2. 部署应用

a. 请点击前往部署[4]打开提供的函数计算应用模板,参考下表进行参数配置,其他参数选择默认配置,然后单击部署项目,最后在弹出面板中单击确认部署,部署预计等待 3~5 分钟。

项目

描述

示例值

地域

推荐地域 华东1(杭州)

默认 华东1(杭州)

VPC ID

阿里云 Milvus 实例所在的 VPC ID。

填写阿里云 Milvus 实例专有网络 ID

交换机 ID

阿里云 Milvus 实例所在的交换机 ID。

填写阿里云 Milvus 实例交换机 ID

安全组 ID

阿里云 Milvus 实例所在的安全组 ID。

填写阿里云 Milvus 实例安全组 ID

百炼 API-KEY

阿里云百炼 API-KEY。

部署资源中获取的阿里云百炼 API-KEY

阿里云 Milvus 数据库名称

用户创建阿里云 Milvus 数据库名称。

test_db

阿里云 Milvus 数据库用户名

用户创建阿里云 Milvus 数据库用户名。

root

阿里云 Milvus 数据库密码

用户创建阿里云 Milvus 数据库密码。

用户在创建阿里云 Milvus 实例时设置的数据库密码

阿里云 Milvus 数据库内网地址

用户创建阿里云 Milvus 实例对应的内网地址。

填写阿里云 Milvus 实例内网地址

阿里云 Milvus 数据库集合名称

用于存储向量数据对应的 collection 名称。

test_collection

部署完成后,类似下图所示:

方案验证

1. 在FunctionAI 项目列表页[5],单击上述步骤创建的项目。

2. 进入项目部署详情页,按照下图找到访问地址。

3. 点击访问地址,即可打开示例应用。

4. 示例应用中,可以选择单张图片上传也可以选择批量数据导入。

5. 可以下载我们为您提供的fruit_img.zip[7]进行方案验证。

a. 在左侧创建数据模块中,选择数据导入页签。

b. 上传提供的测试数据。

c. 选择文本搜索页签,在文本框中输入芒果并将查询数量改为3,随后点击搜索按钮进行查询。

清理资源

测试完方案后,您可以清理对应产品的实例,避免继续产生费用:

1. 删除 Function AI 项目

2. 删除百炼 API Key

3. 删除阿里云 Milvus 实例

4. 删除安全组

5. 删除交换机

6. 放专有网络VPC


参考链接:

[1]阿里云百炼大模型服务平台:https://bailian.console.aliyun.com/?utm_content=g_1000404368

[2]专有网络管理控制台:https://vpcnext.console.aliyun.com/vpc?utm_content=g_1000404862

[3]阿里云 Milvus 管理控制台:https://milvus.console.aliyun.com/cn-hangzhou/home?utm_content=g_1000404863

[4]前往部署:https://cap.console.aliyun.com/create-project?template=milvus-ai-search&from=solution?utm_content=g_1000404864

[5]FunctionAI 项目列表页:https://cap.console.aliyun.com/projects?utm_content=g_1000404865

[6]专有网络组成部分:https://help.aliyun.com/document_detail/34217.html#section-w1b-tvz-ndb?utm_content=g_1000404866

[7]fruit_img.zip:https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250611/gohivf/fruit_img.zip?utm_content=g_1000404867


来源  |  阿里云开发者公众号


相关文章
|
12天前
|
人工智能 自然语言处理 关系型数据库
如何构建和调优高可用性的Agent?浅谈阿里云服务领域Agent构建的方法论
本文深入探讨了Agent智能体的概念、技术挑战及实际落地方法,涵盖了从狭义到广义的Agent定义、构建过程中的四大挑战(效果不稳定、规划权衡、领域知识集成、响应速度),并提出了相应的解决方案。文章结合阿里云服务领域的实践经验,总结了Agent构建与调优的完整路径,为推动Agent在To B领域的应用提供了有价值的参考。
170 18
如何构建和调优高可用性的Agent?浅谈阿里云服务领域Agent构建的方法论
|
12天前
|
存储 JSON 监控
打通数据孤岛:基于对象存储的多云可观测融合实战
在多云环境下,企业面临数据分散、整合效率低、弹性能力不足等挑战。阿里云日志服务(SLS)推出对象导入功能,支持从阿里云OSS和AWS S3高效导入多云日志文件,具备智能文件发现、弹性扩缩容、多种格式解析等能力,实现亿级文件下新增数据分钟级可见,并通过统一分析平台提升跨云数据治理效率。
|
1月前
|
机器学习/深度学习 人工智能 搜索推荐
Deep Search 如何理解业务仓库代码?
本文系统地介绍了 Deep Search 和 Deep Research 的概念、与传统 RAG 的区别、当前主流的商业产品与开源方案、在代码领域的应用(如 Deep Search for 仓库问答)以及未来的发展规划。
211 20
Deep Search 如何理解业务仓库代码?
|
1月前
|
人工智能 安全 API
Agent 工程师绕不开的必修课:API 网关 vs API 管理
本文探讨了“API管理”与“API网关”的起源、发展及差异,二者分别服务于API生命周期的不同阶段。API网关从流量网关演进至AI网关,承担运行时请求控制;API管理则从接口文档化发展到商业化平台,关注全生命周期治理。两者在实际应用中协同工作,通过分层架构和策略联动实现高效运营。未来,随着大模型应用的兴起,AI网关和MCP Server管理将成为新趋势,推动API技术迈入智能化和服务化的新阶段。
Agent 工程师绕不开的必修课:API 网关 vs API 管理
|
5天前
|
人工智能 大数据 开发者
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
阿里云推出基于场景的解决方案免费试用活动,新老用户均可领取100点试用点,完成部署还可再领最高100点,相当于一年可获得最高200元云资源。覆盖AI、大数据、互联网应用开发等多个领域,支持热门场景如DeepSeek部署、模型微调等,助力企业和开发者快速验证方案并上云。
198 15
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
|
12天前
|
人工智能 监控 中间件
深入解析|Cursor编程实践经验分享
本文是近两个月的实践总结,结合在实际工作中的实践聊一聊Cursor的表现。记录在该过程中遇到的问题以及一些解法。问题概览(for 服务端): 不如我写的快?写的不符合预期? Cursor能完成哪些需求?这个需求可以用Cursor,那个需求不能用Cursor? 历史代码分析浅显,不够深入理解? 技术方案设计做的不够好,细节缺失,生成代码的可用性不够满意?
深入解析|Cursor编程实践经验分享
|
19天前
|
存储 机器学习/深度学习 人工智能
基于Memory Bank的Cursor长会话记忆内存库理论研究与实践
本文探讨了Memory Bank在解决大模型长期记忆问题中的应用,特别是在Cursor编程助手中的实践。Memory Bank通过分层存储、动态更新和精准检索机制,有效克服了传统模型在多轮对话中记忆丢失的问题。文章详细介绍了三种工具:Codelf、cursor-memory-bank-rules.md和One-Shot Memory Bank for Cursor的原理、配置及效果评测。其中,cursor-memory-bank-rules.md表现较好,适合项目梳理,但实际开发中的效果仍有待验证。
219 11
基于Memory Bank的Cursor长会话记忆内存库理论研究与实践