让公益数据"会说话":用阿里云百炼打造智能志愿者助手#小有可为#有温度的AI

简介: 将分散的公益文档、音视频资料转化为可对话的智能知识库,支持自然语言检索与图文混排回复。帮助公益组织高效沉淀项目经验、快速响应志愿者咨询,实现从"信息孤岛"到"智慧大脑"的数字化升级。

先来看看最终效果:

志愿者数据.mp4

本案例基于阿里巴巴公益的真实素材,展示如何通过阿里云百炼平台构建一个具备多模态检索能力的智能体。该智能体能够理解用户关于公益活动、宣传片等问题的自然语言查询,并从文档库和视频库中精准定位相关内容,以图文结合的方式呈现答案。

素材数据:

阿里巴巴公益宣传片

阿里巴巴的助残心愿和行动

阿里巴巴公益基金会2025年度工作报告


准备工作

注册并登录阿里云百炼平台

访问 阿里云百炼官网,使用阿里云账号登录。

熟悉界面布局

image.png

了解核心组件

image.png

大模型(LLM - Large Language Model)

作用:智能体的核心推理引擎,负责理解用户意图、生成自然语言响应、进行逻辑推理等。

支持模型:通义千问(Qwen)系列(如 Qwen-Max、Qwen-Plus、Qwen-Turbo)、第三方模型(部分场景支持)。

示例:用户问"帮我写一封请假邮件",LLM 负责生成符合语境的邮件正文。

技能(Tools)

作用:赋予智能体与外部世界交互的能力,扩展其"行动力"。

类型

  • 内置工具:如获取当前时间、执行简单计算、网络搜索(需授权)。
  • 自定义工具:通过 OpenAPI 规范注册企业内部 API(如查询订单、调用 CRM、访问数据库)。

工作机制

  • LLM 根据用户请求判断是否需要调用工具。
  • 自动解析工具参数并发起调用。
  • 将工具返回结果注入上下文,供后续推理使用。

示例:用户说"查一下我昨天的订单状态",智能体调用"订单查询 API"获取数据后回复。

记忆(Memory)

作用:管理对话历史与长期知识,实现上下文连贯性和个性化服务。

类型

  • 短期记忆(对话上下文):自动保存最近 N 轮对话,用于维持多轮交互。
  • 长期记忆(向量知识库):将企业文档、FAQ、产品手册等嵌入为向量,支持语义检索(RAG)。

配置:设置上下文窗口长度。

示例:用户先问"公司年假政策?",后问"那我能休几天?",智能体结合前文和个人信息作答。

提示词模板(Prompt Template)

作用:结构化引导 LLM 行为,提升输出稳定性与准确性。

功能

  • 支持变量插值(如 {{user_input}}, {{tool_result}}
  • 定义角色(Role)、任务目标、输出格式
  • 可复用、可版本管理

示例

你是一位热情且专业的志愿者数据助手,能够根据用户上传的知识库,搜索合适的内容并构建回答。你的任务是帮助用户快速找到他们需要的信息,并提供准确、有用的回答。

创建应用

image.png

提示词拟写(System Prompt)

image.png

# 角色
你是一位热情且专业的志愿者数据助手,能够根据用户上传的知识库,搜索合适的内容并构建回答。你的任务是帮助用户快速找到他们需要的信息,并提供准确、有用的回答。
## 技能
### 技能 1: 理解用户需求
- 深入理解用户的查询意图和需求。
- 如果用户的需求不明确,可以通过进一步提问来获取更多信息。
### 技能 2: 搜索和筛选信息
- 使用知识库中的内容,搜索与用户查询相关的信息。
- 根据用户的查询,筛选出最相关的数据和信息。
### 技能 3: 构建回答
- 根据搜索到的信息,构建一个清晰、准确且有条理的回答。
- 确保回答中包含所有必要的信息,并且易于理解。
### 技能 4: 提供附加信息
- 如果用户需要更多相关信息,可以继续从知识库中搜索并提供。
- 在回答中引用知识库中的具体来源,以增加可信度。
## 约束
- 只使用用户上传的知识库中的信息进行搜索和构建回答。
- 不得提供知识库之外的信息或个人意见。
- 所有回答必须基于知识库中的数据,确保信息的准确性和可靠性。
- 回答时保持客观和中立,避免任何偏见或误导性信息。
## 知识库
- 用户上传的知识库内容将用于搜索和构建回答。请确保在回答时引用具体的来源。
@memory@
## 示例
- 用户询问:"请问关于公司财务报表的相关规定有哪些?"
- 你可以从知识库中搜索相关的财务报表规定,并构建一个详细的回答,包括主要条款和具体要求。
通过以上技能和约束,你将能够高效地帮助用户找到他们需要的信息,并提供高质量的回答。

创建知识库

创建文档知识库 - 阿里巴巴公益

选择图文并茂回答

图文并茂回答,当用户提问涉及包含插图的文档内容时,系统会从原始文档中提取图片及其语义摘要,并由大模型根据问题相关性自主判断是否在回答中插入对应图片,从而实现图文混排的回复效果。

image.png

选择类目,上传文件

image.png

设置索引

阿里云百炼知识库的索引设置主要包括以下几类参数,其含义如下:

  • DenseSimilarityTopK:向量检索 Top K,控制语义相似度召回数量,范围 [0–100],默认 50
  • SparseSimilarityTopK:关键词检索 Top K,控制精确关键词匹配召回数量,范围 [0–100],默认 50
  • RerankMinScore:排序模型输出的最低分数阈值,仅高于此分的切片才会被最终召回,取值范围 [0–1]

image.png

创建音视频知识库 - Alibaba 公益短片

音视频知识库适用于以语音或视频内容为核心载体、需通过自然语言实现语义检索与精准定位的高价值知识沉淀场景。

image.png

上传视频

image.png

image.png

在智能体中添加知识库

image.png

大模型选择:根据不同用途选择不同大模型

image.png


测试对话

用户输入:"2025年阿里巴巴公益做了哪些很有意义的公益活动?"

image.png

image.png

用户输入:"阿里巴巴的公益宣传片也很有创意,解读一下。"

image.png

image.png


应用场景延展

这个智能体架构不仅限于公益领域,还可广泛应用于:

  • 企业知识中枢:整合产品手册、培训资料、FAQ,打造员工自助问答机器人
  • 客户服务升级:基于历史工单和技术文档,实现精准故障诊断与建议
  • 教育资料库:将课件、讲座视频转化为可检索的学习助手
  • 合规审计支持:快速定位政策法规、内部制度中的关键条款

立即体验:访问 阿里云百炼官网 创建你的专属智能体,让组织知识真正"活"起来。


作品欢迎提交作品至仓库,增加作品影响力,一起开源建设,优秀作品会加入官方案例集,获得额外奖励

https://github.com/ModelStudioAI/modelstudioai.github.io/issues/new

总仓库地址,获取更多技能加持,赢胜比赛!https://github.com/modelstudioai


阿里云OPC创新助力计划:单客最高 100万等额 Token补贴、1V1技术陪跑、直通阿里云产品生态、品牌曝光加持、融资与创业空间对接等五大维度权益,加速AI原生新业态的繁荣发展。前往官网:https://opc.aliyun.com/  申领至高百万等额Token补贴。

相关文章
|
4天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1596 2
|
1天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
355 123
|
4天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
596 4
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
15天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
15天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
923 12
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
8天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
678 0
|
3天前
|
消息中间件 人工智能 Kafka
AI 时代,实时入湖正在告别 ETL:从 Kafka 到 Iceberg 的架构减法
本文围绕“零 ETL”这一趋势,讨论流数据入湖为什么需要做架构减法,并结合 Kafka × Table Bucket 的实践,分析一种将通用入湖能力前移到消息与表存储链路中的方案,如何在降低复杂度的同时,兼顾实时性、一致性、Schema 演进、CDC 语义与开放生态兼容。
193 121
|
3天前
|
人工智能 监控 前端开发
Electron 监控:让桌面 Agent 监控触手可及
一行代码实现Electron桌面端全景监控,自动还原崩溃现场、预警内存泄漏、全链路追踪、 SSE流式响应与交互埋点,让 AI 助手运行状态清晰可见,助力快速恢复稳定与流畅。
185 125
|
11天前
|
人工智能 自然语言处理 算法
阿里云百炼Qwen 3.7 Plus与Max实测全解:性价比与多模态能力、成本深度对比
2026年,阿里云百炼平台推出的Qwen 3.7系列成为企业与开发者落地AI应用的核心选择,其中Qwen 3.7 Max与Plus作为两大旗舰版本,定位差异显著:Max是纯文本推理旗舰,专注高强度智能体与复杂逻辑任务;Plus则是多模态全能版,在保留强大文本能力的同时,补齐图像、视频理解能力,且价格大幅降低。本文基于2026年最新实测数据,从核心参数、文本能力、多模态能力、智能体表现、性价比与场景选型六大维度,全面解析两款模型的差异,为用户提供精准选型参考。
549 0