【AI大模型应用开发】3.2 RAG实战 - RAG应用+UI实现加载本地文件并对话

简介: 【AI大模型应用开发】3.2 RAG实战 - RAG应用+UI实现加载本地文件并对话

大家好,我是【同学小张】。持续学习,持续干货输出,关注我,跟我一起学AI大模型技能。

前面我们实现了RAG基本流程,今天我们在此基础上给它加个UI界面,在浏览器打开,实现上传本地文件、解析,并用大模型实现与该文档的对话。也就是一个阉割版demo版的ChatPDF或知识库对话系统。

界面采用Python的gradio库,这个库在机器学习和大模型界很火,它运行后会启动一个Web服务器,并在默认浏览器中打开一个新页面,显示Gradio界面。

别问为啥用这个,就是看大模型的界面好多都是这个库搭的,所以也就用一下。不会gradio没关系,就几行代码,很容易理解。或者可以直接用ChatGPT帮你写一个框架。

首先来安装这个库:

pip install 时加上了清华源,因为我这里使用默认源的话会安装超时,失败。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gradio 

0. 利用大模型帮你创建UI

使用Python的gradio库来创建一个UI界面,该界面可以上传本地文件。

不会gradio也没关系,我也不会,我们可以让大模型帮你写。

当然大模型生成的代码可能会有错误,告诉大模型运行的错误,让大模型一个个修正即可。

完整的对话过程可看这个链接:https://chat.openai.com/share/3db8b8a0-a775-48cc-9833-892fd36e43b8

最终生成的代码如下:

import gradio as gr
def upload_file(input_file):
    file_contents = input_file  # 上传文件对象
    return f"你上传的文件内容是:\n{file_contents}"
gr.Interface(upload_file, 
              inputs="file",
              outputs="text",
              title="文件上传器", 
              description="请点击按钮上传文件。",
              allow_flagging=False).launch()

运行结果(通过浏览器打开下面链接可看到界面):

界面如下:点击可弹出对话框让用户选择本地文件,选择后点击Submit按钮会上传文件,上传成功后在右侧output框里会显示文件信息。

1. 上传文件后的处理

(1)引入前面我们实现的RAG文件和类

(2)实例化一个chat_bot

(3)上传文件时,调用RAG的创建向量数据库接口,创建向量数据库

from rag import RAG_Bot ## 引入前面我们实现的rag文件和类
chat_bot = RAG_Bot() ## 实例化一个chat_bot
# 定义一个处理函数,用于接收上传的文件并进行处理
def upload_file(input_file):
    chat_bot.createVectorDB(input_file) ## 创建向量库,灌入数据
    return f"你上传的文件内容是:\n{input_file}"

2. 添加聊天窗口

其实这里可以另开一个界面,实现聊天窗口,因为聊天和创建向量数据库是独立的。这里为了演示方便,我们在同一个界面上添加一个聊天框。

本人愚笨,用ChatGPT 3.5问了半天,也没有得到正确的代码。于是想了个办法白嫖用了一下 GPT4,好不容易才得到了正确的代码,感觉还不如直接去看gradio的教程来的快。

看下代码:

import gradio as gr
def process_inputs(input_file, chat_input):
    outputs = ["", ""]
    if input_file is not None:  # 处理文件上传
        outputs[0] = f"你上传的文件内容是:\n{str(input_file)}"
    if chat_input != "":  # 处理聊天输入
        outputs[1] = f"你说的是:{chat_input},很高兴与你交流!"
    return tuple(outputs)
# 输入类型为文件上传和文本框
inputs = [gr.File(), gr.Textbox(label="聊天输入")]
# 输出类型为文件内容和聊天输出
outputs = [gr.Textbox(label="文件内容"), gr.Textbox(label="聊天输出")]
iface = gr.Interface(process_inputs, 
                     inputs=inputs,
                     outputs=outputs,
                     title="文件上传和聊天窗口",
                     description="请在适当的输入框中上传文件或进行聊天。",
                     allow_flagging=False)
iface.launch()
  • 运行效果

按照前面在这个代码中添加 【上传文件后的处理】,然后将用户的输入当作query传入RAG中进行对话。最终代码如下:

import gradio as gr
from rag import RAG_Bot ## 引入前面我们实现的rag文件和类
chat_bot = RAG_Bot() ## 实例化一个chat_bot
def process_inputs(input_file, chat_input):
    outputs = ["", ""]
    if input_file is not None:  # 处理文件上传
        chat_bot.createVectorDB(input_file) ## 创建向量库,灌入数据
        outputs[0] = f"你上传的文件内容是:\n{str(input_file)}"
    if chat_input != "":  # 处理聊天输入
        outputs[1] = chat_bot.chat(chat_input) ## 将聊天输入当作query,进行对话
    return tuple(outputs)
# 输入类型为文件上传和文本框
inputs = [gr.File(), gr.Textbox(label="聊天输入")]
# 输出类型为文件内容和聊天输出
outputs = [gr.Textbox(label="文件内容"), gr.Textbox(label="聊天输出")]
iface = gr.Interface(process_inputs, 
                     inputs=inputs,
                     outputs=outputs,
                     title="文件上传和聊天窗口",
                     description="请在适当的输入框中上传文件或进行聊天。",
                     allow_flagging=False)
iface.launch()
  • 运行结果

感想

别看这几行代码,完成的并不容易,因为我不会gradio,用大模型来帮忙写程序固然可以,但大部分情况下写的程序是不对的。

有句话说的很对:AI编程的上限取决于使用者的判断力和能力。

还是要会一点gradio,才能在大模型一直无法得到正确结果时给予正确的引导。

后面有时间还是要学一下gradio库。(要学的东西实在太多了…)


  • 大家好,我是同学小张
  • 欢迎 点赞 + 关注 👏,促使我持续学习持续干货输出
  • +v: jasper_8017 一起交流💬,一起进步💪。
  • 微信公众号也可搜【同学小张】 🙏
  • 踩坑不易,感谢关注和围观

本站文章一览:

相关文章
|
24天前
|
存储 人工智能 分布式计算
Parquet 文件格式详解与实战 | AI应用开发
Parquet 是一种列式存储文件格式,专为大规模数据处理设计,广泛应用于 Hadoop 生态系统及其他大数据平台。本文介绍 Parquet 的特点和作用,并演示如何在 Python 中使用 Pandas 库生成和读取 Parquet 文件,包括环境准备、生成和读取文件的具体步骤。【10月更文挑战第13天】
191 60
|
21天前
|
人工智能 运维 Serverless
【CAP评测有奖】邀您共探 AI 应用开发新趋势,赢取多重好礼!
云应用开发平台 CAP(Cloud Application Platform)是阿里云推出的一站式应用开发和生命周期管理平台。是专为现代开发者打造的一站式解决方案,旨在简化应用开发流程,加速创新步伐。它集成了丰富的 Serverless + AI 应用模板、开源工具链与企业级应用管理功能,让无论是个人还是企业开发者,都能轻松构建云上应用,并实现持续迭代升级。
|
22天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
157 6
|
22天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
40 4
|
23天前
|
存储 人工智能 Java
Neo4j从入门到精通:打造高效知识图谱数据库 | AI应用开发
在大数据和人工智能时代,知识图谱作为一种高效的数据表示和查询方式,逐渐受到广泛关注。本文从入门到精通,详细介绍知识图谱及其存储工具Neo4j,涵盖知识图谱的介绍、Neo4j的特点、安装步骤、使用方法(创建、查询)及Cypher查询语言的详细讲解。通过本文,读者将全面了解如何利用Neo4j处理复杂关系数据。【10月更文挑战第14天】
88 6
|
24天前
|
人工智能 资源调度 数据可视化
【AI应用落地实战】智能文档处理本地部署——可视化文档解析前端TextIn ParseX实践
2024长沙·中国1024程序员节以“智能应用新生态”为主题,吸引了众多技术大咖。合合信息展示了“智能文档处理百宝箱”的三大工具:可视化文档解析前端TextIn ParseX、向量化acge-embedding模型和文档解析测评工具markdown_tester,助力智能文档处理与知识管理。
|
15天前
|
机器学习/深度学习 人工智能 算法
AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
10月30日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
29 1
|
7天前
|
机器学习/深度学习 人工智能 算法
AI在医疗领域的应用与挑战
本文探讨了人工智能(AI)在医疗领域的应用,包括其在疾病诊断、治疗方案制定、患者管理等方面的优势和潜力。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题以及技术局限性等。通过对这些内容的深入分析,旨在为读者提供一个全面了解AI在医疗领域现状和未来发展的视角。
36 10