拍封面,识唱片:UNHEARD 携手阿里云向量 Bucket,用 AI 重新定义实体唱片发现体验

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
简介: UNHEARD 是一款专为黑胶爱好者打造的数字工具,依托阿里云 OSS 向量 Bucket 与百炼多模态模型,首创“以图搜碟”功能——拍封面即识专辑。集海量唱片数据库、唱片店地图、垂直社区于一体,助力用户轻松发现、识别、管理实体唱片。

在全球黑胶市场连续 19 年增长、中国实体唱片消费加速复兴的浪潮下,一款名为 UNHEARD 的 App 正在成为百万唱片爱好者的数字入口。依托阿里云 OSS 向量 Bucket 与百炼多模态 Embedding 模型,UNHEARD 构建了“以图搜碟”智能检索系统——拍一张唱片封面,专辑信息即刻呈现。

黑胶复兴时代,唱片爱好者的“甜蜜烦恼”

截至 2025 年,作为全球第四大音乐消费市场,中国也正在迎来后流媒体时代的音乐消费新热潮——越来越多人走进唱片店,翻找那些“未曾听闻”的黑胶唱片。

然而,对于真正沉浸于唱片世界的收藏者而言,热情背后始终伴随着几个挥之不去的痛点。

  • 信息密度极高,搜索门槛居高不下。 唱片领域的知识体系极为专业,例如古典唱片信息结构复杂,用传统关键字搜索,输入长、易出错、检索精度低。
  • 版本体系庞杂,识别成本高昂面对千万级发行版本,仅靠文字难以精准定位不同唱片的年份、国家、介质等具体版本。
  • 碎片化信息,缺少统一入口国内缺乏权威的实体唱片综合信息平台,价格参考与版本对比高度依赖社群经验。

正是在这样的背景下,UNHEARD 应运而生。

UNHEARD:唱片爱好者的数字百科

UNHEARD 是一款专注于服务实体唱片爱好者的收藏管理工具与内容社区,由北京歌尔丹拿科技有限公司打造。与主流音乐媒体平台不同,UNHEARD 不主打“听”,而是围绕实体唱片的发现、识别、管理、交流与交易构建完整生态。其核心用户画像是在 25 至 45 岁,他们深究版本、在意音质,愿意为好内容的稀缺性与精神共鸣支付溢价。

UNHEARD 的核心功能围绕四大场景展开:

1、一拍识碟拍封面、扫条码,唱片信息一拍即得。这是 UNHEARD 最具标志性的功能,也是用户日常使用频率最高的入口。打开 App 拍一张封面,即可获得完整的唱片信息、版本历史和社区评价。

2、海量唱片数据库平台收录了近 1600 万张发行专辑、250 万个母带以及近 1000 万条艺术家信息,数据维度覆盖作品、艺术家、厂牌、发行年份、介质类型等,支持多维度的精准检索。

3、唱片店地图与线下连接。 全国已有超过 70 家唱片店入驻,覆盖 23 个省 36 个城市。同时,与全国超过 200 家唱片店、市集、主办方等深度联动,将数字用户重新引流回实体空间,重建线下音乐交流场景。

4、垂直音乐社区。 精品专栏、唱片点评、社区热榜,为唱片爱好者打造了一个纯粹、专业的交流空间。

一拍识碟背后的技术密码:阿里云 OSS 向量 Bucket

UNHEARD 最让用户惊艳的功能——“一拍识碟”,其背后正是阿里云 OSS 向量 Bucket 在提供核心支撑。

场景拆解:从“拍照”到“识碟”的毫秒级响应

当用户在 UNHEARD App 中对着一张唱片封面按下快门,一次完整的智能检索在瞬间完成:

  1. 图片上传与预处理: 上传并优化封面图片,确保检索效率与精度。
  2. 多模态向量化: 服务端调用阿里云百炼平台的多模态 Embedding 模型,深度理解图像视觉语义并转化为高维向量。
  3. 向量存储与检索: 转化后的向量数据存储在阿里云 OSS 向量 Bucket 中。OSS 向量 Bucket 是阿里云对象存储 OSS 推出的全新能力,无需客户额外搭建和维护独立的向量数据库。
  4. 结果关联与呈现: 将检索结果与后端元数据匹配,向用户展示完整的唱片信息、版本列表及社区评价。

为什么选择 OSS 向量 Bucket?

对于 UNHEARD 团队而言,选择 OSS 向量 Bucket 有着清晰的业务逻辑:

1、业务初创阶段,成本与效率优先。 UNHEARD 需要一个能够快速上线、弹性扩展且运维成本可控的向量存储方案。OSS 向量 Bucket 作为 OSS 的原生能力,无需额外部署独立的向量数据库集群,直接复用已有的 OSS 存储基础设施,大幅降低了架构复杂度和运营成本。

2、千万级数据规模,需要稳定可靠的底座。 平台当前已累计数千万行向量数据,且每月以数十万行规模增长。OSS 向量 Bucket 天然继承了 OSS 的高可用、高持久和弹性扩展特性,能够从容应对数据量的持续增长。

3、与 AI 生态无缝衔接。 与阿里云百炼同属一个生态,打通“模型调用-数据存储”全链路,减少了跨系统集成成本。

UNHEARD 用 AI 技术降低了唱片发现的门槛,以向量检索简化了繁琐的文字输入,用数字化工具重新连接了实体唱片与爱好者。阿里云 OSS 向量 Bucket 则为这一愿景提供了一个轻量、高效、可弹性拓展的技术底座。这或许就是 AI 时代理想的技术叙事:技术并非为了替代人的热情,而是让热爱更容易被点燃。


OSS 向量 Bucket 最佳实践:快速构建多模态图片语义检索

OSS 向量 Bucket 用于存储、查询和管理向量数据,基于向量 Bucket 和阿里云大模型服务平台百炼的多模态 Embedding 模型,可以搭建海量图片的智能语义检索系统,实现基于自然语言描述的文搜图能力的最佳实践,适用于电商商品搜索、智能相册、媒体资产管理、AI 语义检索、图片知识库等场景。

使用命令行工具 ossutil 2.0 在多种操作系统中高效管理阿里云对象存储 OSS 资源,向量 Bucket 级命令提供对 OSS 向量 Bucket 的 API 的直接访问,适合开发者、运维人员和企业进行大规模数据迁移和日常运维操作。

Step 1: 创建向量 Bucket & 向量索引

创建向量 Bucket

ossutil vectors-api put-vector-bucket \
  --bucket <VECTOR_BUCKET> \
  --account-id <ACCOUNT_ID> \
  --region cn-beijing

创建向量索引

ossutil vectors-api put-vector-index \
  --bucket <VECTOR_BUCKET> \
  --index-name <INDEX_NAME> \
  --dimension 1024 \
  --data-type float32 \
  --distance-metric cosine \
  --account-id <ACCOUNT_ID> \
  --region cn-beijing

Step 2: 生成图片预签名 URL(私有 Bucket 必选)

如果 Bucket 的 ACL 为 private(默认),百炼 API 无法直接访问图片,需要先生成预签名 URL:

ossutil presign oss://<SOURCE_BUCKET>/example.jpg \
  -e oss-cn-beijing.aliyuncs.com \
  --expires-duration 1h

输出示例:

https://<SOURCE_BUCKET>.oss-cn-beijing.aliyuncs.com/example.jpg?x-oss-credential=...&x-oss-date=...&x-oss-expires=3600&x-oss-signature=...&x-oss-signature-version=OSS4-HMAC-SHA256

批量生成:

ossutil presign oss://<SOURCE_BUCKET>/ -r \
  --include "*.jpg" --include "*.webp" \
  --expires-duration 1h

Step 3: 调用百炼多模态 Embedding 模型

使用百炼 API 将图片转换为 1024 维向量(模型名:multimodal-embedding-one-peace-v1):

curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/embeddings/multimodal-embedding/multimodal-embedding-v1" \
  -H "Authorization: Bearer <DASHSCOPE_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "multimodal-embedding-one-peace-v1",
    "input": {
      "image_url": "<PRESIGNED_URL>"
    }
  }'

响应中 output.embedding 字段即为 1024 维向量数据。

Step 4: 向量写入

将向量数据写入向量索引。支持 JSON 文件批量写入:

vectors.json 格式:

[
  {
    "data": {
      "float32": [0.123, -0.456, ...]
    },
    "key": "example.jpg",
    "metadata": {
      "source_bucket": ["<SOURCE_BUCKET>"],
      "image_name": ["example.jpg"]
    }
  }
]

写入命令:

ossutil vectors-api put-vectors \
  --bucket <VECTOR_BUCKET> \
  --index-name <INDEX_NAME> \
  --vectors file://vectors.json \
  --account-id <ACCOUNT_ID> \
  --region cn-beijing
  提示: --vectors 支持内联 JSON 或 file:// 前缀读取文件。单次写入建议不超过 10 条。

Step 5: 语义检索

# 用获取的向量执行近邻检索(内联 JSON 方式)
QUERY_VECTOR='{"float32":[0.0284,-0.0284,...]}'
ossutil vectors-api query-vectors \
  --bucket <VECTOR_BUCKET> --index-name <INDEX_NAME> \
  --query-vector "$QUERY_VECTOR" \
  --top-k 10 --return-distance --return-metadata \
  --account-id <ACCOUNT_ID> --region cn-beijing
  # 列出所有向量
ossutil vectors-api list-vectors \
  --bucket <VECTOR_BUCKET> \
  --index-name <INDEX_NAME> \
  --account-id <ACCOUNT_ID> \
  --region cn-beijing
# 查询特定向量
ossutil vectors-api get-vectors \
  --bucket <VECTOR_BUCKET> \
  --index-name <INDEX_NAME> \
  --keys example.jpg \
  --return-data \
  --return-metadata \
  --account-id <ACCOUNT_ID> \
  --region cn-beijing

相关文章
|
1天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1566 0
|
11天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
12天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
854 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
12天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
881 8
|
1天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
351 2
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
12天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2413 7
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
12天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
8天前
|
人工智能 自然语言处理 算法
阿里云百炼Qwen 3.7 Plus与Max实测全解:性价比与多模态能力、成本深度对比
2026年,阿里云百炼平台推出的Qwen 3.7系列成为企业与开发者落地AI应用的核心选择,其中Qwen 3.7 Max与Plus作为两大旗舰版本,定位差异显著:Max是纯文本推理旗舰,专注高强度智能体与复杂逻辑任务;Plus则是多模态全能版,在保留强大文本能力的同时,补齐图像、视频理解能力,且价格大幅降低。本文基于2026年最新实测数据,从核心参数、文本能力、多模态能力、智能体表现、性价比与场景选型六大维度,全面解析两款模型的差异,为用户提供精准选型参考。
429 0

热门文章

最新文章