使用 Embedchain 和 databutton 构建在线 AI 学习助理

简介: 使用 Embedchain 和 databutton 构建在线 AI 学习助理

image.png

之前探索使用 OpenAI、LangChain 和 LlamaIndex 构建 Knowledge,需要自己整理文档数据集,本文来探索另一种实现方式,将数据集换成输入一个 URL (嵌入在线资源),通过使用 Embedchaindatabutton 来构建 Knowledge 聊天机器人。

什么是 Embedchain

Embedchain  是一个多功能框架,可以轻松地在任何数据集上创建强大的 LLM 支持的聊天机器人。框架负责处理复杂的任务,例如从网页、PDF 和博客文章等各种来源加载数据。然后将数据分成有意义的块,生成嵌入 embeddings 以进行高效查询,并将这些块存储在矢量数据库中以便快速检索。

image.png

简而来说,使用基于  Embedchain 的聊天机器人的简单工作流程:当用户与聊天机器人交互并发送查询信息时,用户的查询将转换为嵌入 embedding 表示(为查询创建嵌入)。同时 Embedchain 搜索向量数据库以查找与用户查询相关的相似文档(查找相似文档)。最后,将类似的文档作为上下文提供给语言模型 (LLM),以生成最佳答案(将上下文传递给 LLM)。

什么是 databutton

Databutton 是人工智能驱动的工作区,用于构建和共享数据应用程序。

使用 Streamlit 构建

创建一个简单的 Web 应用程序,允许用户使用 Embedchain 强大的自然语言处理功能与在线资源进行交互,为给定的查询信息提供相关且准确的响应。

项目开始的基本流程:

  1. 创建项目目录
  2. 创建虚拟环境
  3. 激活虚拟环境
  4. 安装项目需要的依赖库
  5. 开始创建代码文件导库开始代码

创建项目目录,然后打开终端在项目目录下创建虚拟环境:


python -m venv venv

激活虚拟环境 venv


source venv/bin/activate  #for mac
venv\Scripts\activate     #for windows users

安装项目需要的依赖库,逐行执行以下命令:


pip install --upgrade pip
pip install databutton streamlit embedchain

创建 python 文件 main.py ,从导库开启代码之旅:


import databutton as db
import streamlit as st
from embedchain import App
import os
import time

其中 os 用于与操作系统交互并设置环境变量。下面使用简单的 Streamlit API 添加应用程序相关信息:


st.subheader("Embedchain AI Knowledge 🤖 ")
st.markdown(
    "Repo : [AI-DevSecOps](https://github.com/QuintionTang/AI-DevSecOps)")

接下来,创建一个函数 initBot,函数将 URL 作为输入,即通过嵌入在线资源。


@st.cache_resource
def initBot(URL):
    # 创建一个机器人实例
    devsec_bot = App()
    # 这里支持嵌入多个在线资源
    devsec_bot.add("web_page", URL)
    # devsec_bot.add("youtube_video", "")
    # devsec_bot.add("pdf_file", "")
    # devsec_bot.add("web_page", "")
    return devsec_bot

函数 initBot 使用装饰器 @st.cache_resource 定义的,装饰器主要缓存资源,以避免在用户重新加载 Web 应用程序时重复初始化。而返回值是初始化的 ChatBot 对象,在这里将实例化的机器人命名为 devsec_bot

接下来实现通过 URL 输入并初始化 ChatBot:


prompt = st.text_input(
    "请输入一个内容URL",
    placeholder="请输入一个内容URL",
)
btn = st.button("初始化机器人")
if btn or st.session_state.btn_state:
    st.session_state.btn_state = True
    devsec_bot = initBot(prompt)
    st.success("机器人已就绪🤖")

st.text_input() 创建一个输入框,提示用户输入 URL。st.button("初始化机器人") 创建一个 初始化机器人 按钮。如果单击初始化机器人 按钮或聊天机器人已初始化(即 st.session_state.btn_stateTrue),则使用已经获取的 URL 初始化 ChatBot,并显示 机器人已就绪🤖 的消息。

接下来将使用 Streamlit 的 Chat 元素st.chat_messagest.chat_input

从这里开始将介绍如何使用 embedchain 实现查询方法逻辑,然后将 LLM 的响应转储并将回复内容显示在 UI 中。为了保持聊天对话的连续性,消息将通过 Streamlit 的会话状态 API 进行处理。


# 初始化聊天记录
if "messages" not in st.session_state:
    st.session_state.messages = []
# 在应用程序重新运行时显示历史记录中的聊天消息
for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(message["content"])

聊天查询内容通过 st.chat_input 来获取,其功能和 st.text_input 非常相似。一旦聊天内容已发送,它就会被保存在会话状态中,以便后续在聊天界面中延续使用。


# 接收聊天内容
if prompt := st.chat_input("有什么可以帮忙?"):
    # 增加聊天历史记录
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"):
        st.markdown(prompt)
    with st.chat_message("assistant"):
        message_placeholder = st.empty()
        full_response = ""

下面这行代码是整个机器人的核心代码:


assistant_response = devsec_bot.query(prompt)

到此整个聊天机器人核心的代码已经完成了,其余代码主要在 streaming 传输响应中发挥关键作用,类似 ChatGPT 风格!

运行代码:


streamlit run main.py

image.png

下面来看下增加的个人博客连接资源的学习效果:

image.png

从结果来看,效果还不错。

总结

Embedchain 提供了一个非常强大的功能,只需几行代码即可轻松构建在线聊天机器人。本文完成的聊天机器人还存在不足,输入的 URL 内容为中文,机器人回复的内容为英文。这里只是介绍了一个简单的应用场景,没有提供主题隔离,如果加载的资源比较混乱,机器人的回答也是混乱的,算是开拓了一种新的实现AI聊天机器人思路。


相关文章
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
构建未来的开发环境:AI 驱动的代码助手
随着人工智能技术的进步,AI驱动的代码助手成为提升软件开发效率和代码质量的关键工具。本文探讨了其潜在功能、技术实现及对未来开发的影响。优势包括自动化任务、实时错误检测、个性化辅助和知识共享。技术上,它结合了机器学习、自然语言处理和深度学习,实现代码理解和推荐、智能补全、自动化测试、代码审查及性能优化等功能,使开发更加高效智能。
|
10天前
|
人工智能
AI助手伴学习,通义灵码开启新学期第一课​
AI助手伴学习,通义灵码开启新学期第一课​
27 3
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
构建智能化编程环境:AI 与代码编辑器的融合
在人工智能的推动下,未来的代码编辑器将转变为智能化编程环境,具备智能代码补全、自动化错误检测与修复、个性化学习支持及自动化代码审查等功能。本文探讨了其核心功能、技术实现(包括机器学习、自然语言处理、深度学习及知识图谱)及应用场景,如辅助新手开发者、提升高级开发者效率和优化团队协作。随着AI技术进步,智能化编程环境将成为软件开发的重要趋势,变革开发者工作方式,提升效率,降低编程门槛,并推动行业创新。
|
17天前
|
人工智能 运维 负载均衡
10 分钟构建 AI 客服并应用到网站、钉钉或微信中
《10分钟构建AI客服并应用到网站、钉钉或微信中》的解决方案通过详尽的文档和示例代码,使具有一定编程基础的用户能够快速上手,顺利完成AI客服集成。方案涵盖高可用性、负载均衡及定制化选项,满足生产环境需求。然而,若文档不清晰或存在信息缺失,则可能导致部署障碍。实际部署中可能遇到网络、权限等问题,需逐一排查。云产品的功能、性能及操作配置便捷性直接影响解决方案效果,详尽的产品手册有助于快速解决问题。总体而言,该方案在各方面表现出色,值得推荐。
|
16天前
|
机器学习/深度学习 人工智能 运维
|
2天前
|
人工智能 搜索推荐 算法
AI与未来教育:个性化学习的实践
【10月更文挑战第3天】在21世纪科技浪潮中,人工智能(AI)正重塑教育领域,尤其在个性化学习方面展现出巨大潜力。本文探讨了AI如何通过智能评估、定制化学习路径、情感识别及虚拟助教等方式,提升教育质量和效率,激发每个学生的学习潜能。尽管面临数据隐私和技术普及等挑战,AI与未来教育的融合正开启新篇章,有望实现真正的“因材施教”。
|
9天前
|
人工智能 自然语言处理 API
深入浅出 LangChain 与智能 Agent:构建下一代 AI 助手
我们小时候都玩过乐高积木。通过堆砌各种颜色和形状的积木,我们可以构建出城堡、飞机、甚至整个城市。现在,想象一下如果有一个数字世界的乐高,我们可以用这样的“积木”来构建智能程序,这些程序能够阅读、理解和撰写文本,甚至与我们对话。这就是大型语言模型(LLM)能够做到的,比如 GPT-4,它就像是一套庞大的乐高积木套装,等待我们来发掘和搭建。
|
10天前
|
人工智能
解决方案评测|10分钟构建AI客服并应用到聊天系统中获奖名单公布
10分钟构建AI客服并应用到聊天系统中获奖名单公布!!!
|
8天前
|
机器学习/深度学习 数据采集 人工智能
探索AI技术在文本生成中的应用与挑战
【9月更文挑战第26天】本文深入探讨了AI技术在文本生成领域的应用,并分析了其面临的挑战。通过介绍AI文本生成的基本原理、应用场景以及未来发展趋势,帮助读者全面了解该技术的潜力和局限性。同时,文章还提供了代码示例,展示了如何使用Python和相关库实现简单的文本生成模型。
33 9
|
2天前
|
人工智能 自然语言处理 搜索推荐
AI技术在智能客服系统中的应用与挑战
【9月更文挑战第32天】本文将探讨AI技术在智能客服系统中的应用及其面临的挑战。我们将分析AI技术如何改变传统客服模式,提高服务质量和效率,并讨论在实际应用中可能遇到的问题和解决方案。
93 65

热门文章

最新文章

下一篇
无影云桌面