云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 RAG 和联网搜索 的 AI 智能问答应用。该应用通过将 RAG、web search 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了额外的联网搜索和特定领域知识库检索的能力,提升了智能回答的效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 RAG 和联网搜索 的 AI 智能问答应用。该应用通过将 RAG、web search 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了额外的联网搜索和特定领域知识库检索的能力,提升了智能回答的效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。


一、背景信息

Qwen3

Qwen3 作为 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家(MOE)模型。基于广泛的训练,Qwen3 在推理、指令跟随、代理能力和多语言支持方面取得了突破性的进展,具有以下关键特性:

  • 独特支持在思考模式(用于复杂逻辑推理、数学和编码)和非思考模式(用于高效通用对话)之间无缝切换,确保在各种场景下的最佳性能。
  • 显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ(在思考模式下)和 Qwen2.5指令模型(在非思考模式下)。
  • 擅长 Agent 能力,可以在思考和非思考模式下精确集成外部工具,在复杂的基于代理的任务中在开源模型中表现领先。
  • 支持100多种语言和方言,具有强大的多语言理解、推理、指令跟随和生成能力。

PAI-LangStudio

LangStudio 是依托阿里云 PAI 平台核心能力构建的面向企业级用户的一站式 LLM 大模型应用开发平台,它提供了灵活的可编程、评测和调试能力,帮助开发者快速构建端到端的 AI 应用。在智能问答应用方面,LangStudio 连通了离线知识库构建和在线应用开发两条链路,帮助用户轻松跨越从 demo 到生产的鸿沟。

通过 Qwen3 与 LangStudio 结合,既可以发挥 SOTA LLM 优秀的推理能力,也可以发挥平台产品在流程编排、开发调试、权限管控等方面的优势,帮助客户高效的构建适合生产部署的智能问答应用,在效果和成本上达到最好的平衡。

具体地说,本方案具有以下优势:

  • 精准回答:通过 RAG 从知识库中提取领域专业知识,结合实时网络数据补充最新信息,最大限度提升回答准确度、减少幻觉。
  • 灵活扩展:开发者可使用自定义模型和自定义知识库,并能灵活修改应用流 DAG 构成,以满足自身特有的业务需求。
  • 安全可控:LangStudio 背靠阿里云 PAI 平台,通过将模型服务、知识库等放在用户私有网络中,并结合阿里云精细化的权限管控体系,达到最大程度的数据安全。


二、前提条件

1. 开通阿里信息查询服务-IQS,注册账号并获取 api_key(可通过信息查询服务-凭证管理获取)。可参考以下开通流程。

  • 开通阿里信息查询服务-IQS,详情请参见联网搜索开通说明。
  • 通过信息查询服务-凭证管理获取 IQS 对应的访问凭证 api_key。

image.png

2. LangStudio 向量数据库连接,支持使用 Faiss 或 Milvus 向量数据库。若您希望使用 Milvus 数据库,您需要先完成 Milvus 数据库的创建,详情请参见创建 Milvus 实例实例管理

说明:Faiss 通常用于测试环境,无需额外创建数据库即可使用。在生产环境中,建议您使用 Milvus 数据库,支持处理更大规模的数据。

3. 已将 RAG 知识库语料上传至 OSS


三、LangStudio 部署步骤

步骤一:在 Model Gallery 中部署Qwen3 和 Embedding 模型

1.1 部署 Qwen3 大模型

1. 进入PAI控制台 > Model Gallery,选择 大语言模型 场景。

image.png

2. 根据业务场景选择部署 Qwen3 模型,此实践中选择 Qwen3-8B。  

  • 以下是 Qwen3 系列不同模型的建议配置信息

image.png

  • 以部署 Qwen3-8B 为例,以下状态表示部署正在进行中:

image.png

3. 单击查看调用信息,记录部署后的服务访问地址(base_url)及 API Token(api_key)。

1.2 部署 Embedding 模型

1. PAI 控制台 > Model Gallery 下,选择 Embedding 场景,部署 bge-m3 通用向量模型(与 Qwen3 兼容性最佳)。  

2. 记录服务地址及 Token,用于后续知识库索引构建。

image.png

步骤二:LangStudio 配置服务连接

2.1 创建连接-Qwen3 模型服务

1. 通过 PAI 控制台 > 进入 LangStudio > 连接 > 模型服务,单击新建连接

2. 关键参数:  

  • 模型名称Qwen3-8B (需与部署名称一致)。  
  • 服务提供方:选择 PAI-EAS 模型服务,自动显示部署后的 base_url 和 api_key。  

image.png

2.2 创建连接-Embedding 模型

1. 通过 PAI控制台 > 进入 LangStudio > 连接 > 数据库

2. 选择已部署的 bge-m3 模型,配置服务地址及密钥。

image.png

2.3 创建连接-联网搜索 IQS  

1. 通过 PAI 控制台 > 进入 LangStudio > 连接 > 自定义连接

2. 填写 IQS 的 api_key,名称设为 IQS_Conn。  

image.png

步骤三:构建知识库索引

1. 进入 LangStudio > 知识库索引,单击新建知识库索引

2. 关键配置配置如下:  

  • 数据源 OSS 路径:填写知识库语料的 OSS 路径(如 oss://my-bucket/rag-data/)。  
  • 通用 Embedding 模型:选择步骤 1.2 中创建的 bge-m3 连接。  
  • 向量数据库:生产环境选择向量数据库-Milvus,测试环境选择 Faiss。  

image.png

3. 启动索引构建,等待知识库构建任务完成。  

步骤四:开发 Agent 应用流 & 调试与优化

4.1 开发 AI 应用流

1. 进入 LangStudio > 应用流 > 新建应用流模板选择 “基于 Web 搜索和 RAG 的聊天助手”。  

image.png

2. 关键节点配置:  

  • 节点-知识库检索:  
  • 索引名称:选择步骤三中创建的知识库。  
  • Top K:建议设置为5(根据知识库规模调整)。  
  • 节点-阿里云 IQS-联网搜索:  
  • 连接:选择`IQS_Conn`。  

image.png

  • 节点-大模型节点:  
  • 模型连接:选择步骤一的 Qwen3 模型服务。
  • 系统提示词模板:可自定义,例如:  

   基于以下知识库内容和网络搜索结果,请用中文专业且简洁地回答用户问题: 

   - 知识库内容:{knowledge}  

   - 网络搜索结果:{web_results}  

   - 用户问题:{question}  

image.png

4.2 Qwen3 思考模式切换 (快思考与慢思考)

Qwen3 支持混合推理形态模型,同时提供“推理模式”和“非推理模式”(慢思考与快思考模式)。可通过大模型节点的启用思考参数配置模型 来控制是否启用推理模式。

image.png

4.3 调试与优化

1. 运行测试:  

  • 输入测试问题(如“最新科创板上市规则有哪些变化?”),观察模型生成的回答质量。  
  • 运行完成后,可通过查看链路查看 Tracing 信息,分析 Qwen3 大模型整合 RAG 检索结果与网络搜索的结果相关性。

2. 优化策略:  

  • 知识库增强:若回答缺乏领域细节,扩充知识库语料并重建索引。  

  • 搜索过滤:在 IQS 中设置 time_period 参数,限定搜索时间范围(如 past_year)。  

  • 提示词调优:增加格式约束(如“分点回答”、“引用来源”等),提升结果可读性。

步骤五:模型服务部署与 API 调用

5.1 生产部署:  

  • 在 LangStudio > 应用流页面单击右侧-部署,选择新建服务 > EAS 资源组。
  • 资源分配:建议至少2实例(HA),配置具备公网访问的 VPC。  

image.png

5.2 PAI API 调用:  

请求示例(Python):  

import requests  
endpoint = "YOUR_EAS_ENDPOINT"  
payload = {  
    "question": "解释量子计算对金融风险建模的影响",  
    "history": []  # 支持多轮对话  
}  
response = requests.post(endpoint, json=payload, headers={"Authorization": "Bearer YOUR_API_KEY"})  
print(response.json()["answer"])  


步骤六:监控与维护

  • 应用流调试:使用 LangStudio 应用流中的运行对话框,输入所需查询的问题,观察查询结果内容。
  • 日志查看监控:通过 PAI-EAS 控制台监控服务请求量、延迟及错误率。  
  • 知识库更新:定期上传新语料到 OSS,触发增量索引构建。  
  • LLM 模型升级:关注 Qwen3 版本更新,通过 Model Gallery 无缝替换新版本。  


附录:常见问题

  • Q:网络搜索结果不相关?
    A:通过“查询链路”来查看 Tracing 联网信息是否正确。

相关链接

通过以上步骤,您可快速使用 LangStudio 构建基于 Qwen3 的高效增强 RAG+联网搜索的 AI 智能问题应用,满足专业场景需求。

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
29天前
|
人工智能 自然语言处理 数据挖掘
云上玩转Qwen3系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用
PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用,通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。
|
21天前
|
人工智能 测试技术 API
通义灵码 + 魔搭MCP:全流程构建创空间应用
最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署
406 26
|
22天前
|
机器学习/深度学习 人工智能 自然语言处理
Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PAI 上进行快速部署使用。
|
8天前
|
人工智能 安全 网络安全
网络安全厂商F5推出AI Gateway,化解大模型应用风险
网络安全厂商F5推出AI Gateway,化解大模型应用风险
20 0
|
22天前
|
机器学习/深度学习 数据采集 人工智能
20分钟掌握机器学习算法指南
在短短20分钟内,从零开始理解主流机器学习算法的工作原理,掌握算法选择策略,并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻,帮助你告别算法选择的困惑,轻松踏入AI的大门。
86 7
|
18天前
|
机器学习/深度学习 算法 搜索推荐
认识聚类算法【机器学习必学】
处理网https://www.91chuli.com/
|
7月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
413 6
|
2月前
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
124 6
|
4月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。

相关产品

  • 人工智能平台 PAI