使用Gradio快速搭建一个聊天机器人

简介: 使用Gradio快速搭建一个聊天机器人

Gradio 简介

如果对 Gradio 库不太了解的,可以先参考一下:Gradio快速入门

使用 Gradio 这个 Python 库来开发这个聊天机器人图形界面有如下几个好处:

  • 之前的的代码都是用 Python 实现的,不需要去学习前端相关框架了。
  • Gradio 渲染出来的界面可以直接在 Jupyter Notebook 里面显示出来。
  • 可以免费把 Gradio 的应用部署到 HuggingFace 上,特别方便我们的系统演示给其他人看。

三步完成图形界面开发

  1. 定义好了 system 这个系统角色的提示语,创建了一个 Conversation 对象。参考:
  2. 定义了一个 answer 方法,简单封装了一下 Conversation 的 ask 方法。主要是通过 history 维护了整个会话的历史记录。并且通过 responses,将用户和 AI 的对话分组。然后将它们两个作为函数的返回值。这个函数的签名是为了符合 Gradio 里 Chatbot 组件的函数签名的需求。
  3. 通过一段 with 代码,创建对应的聊天界面。Gradio 提供了一个现成的 Chatbot 组件,我们只需要调用它。

代码如下:

importgradioasgrprompt="""你是一个大数据和AI领域的专家,用中文回答大数据和AI的相关问题。你的回答需要满足以下要求:1. 你的回答必须是中文2. 回答限制在100个字以内"""conv=Conversation(prompt, 6)
defanswer(question, history=[]):
history.append(question)
message=conv.ask(question)
history.append(message)
responses= [(u,b) foru,binzip(history[::2], history[1::2])]
print(responses)
returnresponses, historywithgr.Blocks(css="#chatbot{height:300px} .overflow-y-auto{height:500px}") asrxbot:
chatbot=gr.Chatbot(elem_id="chatbot")
state=gr.State([])
withgr.Row():
txt=gr.Textbox(show_label=False, placeholder="请输入你的问题").style(container=False)
txt.submit(answer, [txt, state], [chatbot, state])
rxbot.launch()

部署到 HuggingFace

HuggingFace 简介

HuggingFace 的官方网站:https://huggingface.co 我们可以看到如下一些资源。

  • Datasets:数据集,以及数据集的下载地址
  • Models:各个预训练模型
  • Docs:文档
  • Spaces:发布的一些应用,这次就使用这个菜单进行程序部署

注册帐号

需要注册一个 HuggingFace 的账号,点击左上角的头像,然后点击 “+New Space” 创建一个新的项目空间。

创建 Space

在接下来,给 Space 取一个名字【1】,然后在 Select the Space SDK 里面,选择第二个 Gradio【2】。硬件选择免费的【3】,项目这里选择 public【4】,让其他人也能够看到。最后点击创建【5】。

发布代码

创建成功后,会跳转到 HuggingFace 的 App 界面。里面给了如何 Clone 当前的 space,然后提交代码部署 App 的方式。如下图:

按照上面的示例,需要通过 Git 把当前 space 下载下来,然后提交两个文件

  • app.py 包含了我们的 Gradio 应用;
  • requirements.txt 包含了这个应用依赖的 Python 包。

代码提交之后,HuggingFace 的页面会自动刷新

设置环境变量

代码里是通过环境变量获取 OpenAI 的 API Key 的,所以还要在这个 HuggingFace 的 Space 里设置一下这个环境变量。如下图:

设置完成之后,需要手动点击一下 Restart this space 确保这个应用重新加载一遍,以获取到新设置的环境变量。

效果体验

到此,再切换到 APP Tab,尝试下聊天机器人是否可以正常工作了,如下图:

遇到的问题

Q:提交问题后,界面上没有返回对话内容,通过查看日志,发现如下错误:

AttributeError("module 'openai' has no attribute 'ChatCompletion'"))]

A:解决方案

在 requirements.txt 中指定 openai 库的版本号

openai==0.27.0

Q:遇到访问限流的问题,日志如下:

A:解决方案

  1. 过会再试
  2. 通过使用 backoff 库,遇到 RateLimitError 的时候,按照指数级别增加等待时间,可以参考官网对限流的说明:https://platform.openai.com/docs/guides/rate-limits/overview

聊天APP分享到自己的网站上

导入代码

通过在站点中添加以下脚本将 gradioJS 库导入到站点中

<scripttype="module"src="https://gradio.s3-us-west-2.amazonaws.com/3.28.1/gradio.js"></script><gradio-appsrc="https://yezhiwei-chatbot.hf.space"></gradio-app>

获取方式

通过以下方式获取上面的代码,如下图:

集成效果

体验方式

访问 https://yezhwi.github.io/ 访问,进入二级页面(如:https://yezhwi.github.io/ai/2023/03/27/3%E5%88%86%E9%92%9F%E9%83%A8%E7%BD%B2ChatGPT%E6%9C%8D%E5%8A%A1%E7%AB%AF%E5%BA%94%E7%94%A8-%E9%99%84%E4%BB%A3%E7%A0%81/),拖到最下方,即可体验:


相关文章
|
机器学习/深度学习 数据采集 自然语言处理
ModelScope保姆式教程带你玩转语言生成模型
PALM预训练语言生成模型是针对实际场景中常见的文本生成需求所设计的一个模型。模型利用大量无监督数据,通过结合自编码和自回归任务进行预训练,更贴合下游生成任务所同时需要的理解和生成能力。
35599 4
ModelScope保姆式教程带你玩转语言生成模型
|
人工智能 自然语言处理 安全
90.9K star!一键部署AI聊天界面,这个开源项目让大模型交互更简单!
"像使用微信一样操作大模型!Open WebUI 让AI对话从未如此简单"
1981 0
|
机器人 API UED
Gradio 流式输出教程
本文是Gradio流式输出教程,介绍了如何通过Gradio的Blocks API实现聊天机器人的流式文本输出,包括两个示例:一个简单的ChatBot流式输出示例和一个更复杂的输入处理与输出分离的流式输出示例,旨在改善用户体验并为实时处理积累技术。
Gradio 流式输出教程
|
存储 人工智能 API
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
AgentScope是阿里巴巴集团开源的多智能体开发平台,旨在帮助开发者轻松构建和部署多智能体应用。该平台提供分布式支持,内置多种模型API和本地模型部署选项,支持多模态数据处理。
15013 78
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
|
机器学习/深度学习 人工智能 测试技术
PsycoLLM:开源的中文心理大模型,免费 AI 心理医生,支持心理健康评估与多轮对话
PsycoLLM 是合肥工业大学推出的中文心理大语言模型,基于高质量心理数据集训练,支持心理健康评估、多轮对话和情绪识别,为心理健康领域提供技术支持。
4070 51
PsycoLLM:开源的中文心理大模型,免费 AI 心理医生,支持心理健康评估与多轮对话
|
存储 人工智能
Ollama 本地运行 Qwen 3
本指南介绍如何安装和配置Ollama。首先,从官网下载Ollama并选择适合的安装方式:傻瓜式安装或指定路径安装。安装完成后,可通过系统环境变量配置模型下载路径(可选)。最后,运行对应模型命令进行测试使用,包括选择参数量、复制命令并在命令行工具中执行,验证安装是否成功。
6924 19
|
搜索推荐 物联网 PyTorch
Qwen2.5-7B-Instruct Lora 微调
本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。
14494 34
Qwen2.5-7B-Instruct Lora 微调
|
人工智能 自然语言处理 API
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
百聆是一款开源的AI语音对话助手,结合ASR、VAD、LLM和TTS技术,提供低延迟、高质量的语音对话体验,适用于边缘设备和低资源环境。
4820 5
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms