【LLM】基于Stable-Diffusion模型构建可以生成图像的聊天机器人

简介: 【4月更文挑战第13天】基于Stable-Diffusion模型构建可以生成图像的聊天机器人

[toc]


今天,我从头开始创建图像生成聊天机器人。按照已经构建的聊天机器人 awesome-tiny-sd 的脚本来执行

awesome-tiny-sd项目地址:https://astrabert.github.io/awesome-tiny-sd

环境准备

安装依赖库

python3 -m pip install gradio==4.25.0 diffusers==0.27.2 torch==2.1.2 pydantic==2.6.4 accelerate transformers trl peft

安装完毕之后,在当前文件夹中创建文件如下:

./
|__ app.py
|__ imgen.py

第一步:导入stable-diffusion

导入stable-diffusion模型到imgen.py文件中

  • 导入依赖选项

    from diffusers import DiffusionPipeline
    import torch
    
  • 定义图像生成管道(这将自动下载您指定的稳定扩散模型及其所有相关组件

    pipeline = DiffusionPipeline.from_pretrained("segmind/small-sd", torch_dtype=torch.float32)
    

    我们选择的是segmind/small-sd,这个模型不是很大,而且对CPU支持友好。

    segmind/small-sd下载地址:https://huggingface.co/segmind/small-sd

第二步:定义核心函数

  • 导入依赖选项

    import gradio as gr
    import time
    from imgen import *
    
  • 定义一个简单功能,打印用户喜欢的和不喜欢的信息

    def print_like_dislike(x: gr.LikeData):
        print(x.index, x.value, x.liked)
    
  • 将新消息和/或上传的文件附加到聊天机器人历史记录的功能:

    def add_message(history, message):
        if len(message["files"]) > 0:
            history.append((message["files"], None))
        if message["text"] is not None and message["text"] != "":
            history.append((message["text"], None))
        return history, gr.MultimodalTextbox(value=None, interactive=False)
    
  • 从文本提示符开始生成图像的函数:

    def bot(history):
        if type(history[-1][0]) != tuple: ## text prompt
            try:
                prompt = history[-1][0]
                image = pipeline(prompt).images[0] ## call the model
                image.save("generated_image.png")
                response = ("generated_image.png",)
                history[-1][1] = response
                yield history ## return the image
            except Exception as e:
                response = f"Sorry, the error '{e}' occured while generating the response; check [troubleshooting documentation](https://astrabert.github.io/awesome-tiny-sd/#troubleshooting) for more"
                history[-1][1] = ""
                for character in response:
                    history[-1][1] += character
                    time.sleep(0.05)
                    yield history
        if type(history[-1][0]) == tuple: ## input are files
            response = f"Sorry, this version still does not support uploaded files :(" ## We will see how to add this functionality in the future
            history[-1][1] = ""
            for character in response:
                history[-1][1] += character
                time.sleep(0.05)
                yield history
    

第三步:构建聊天机器人

  • 使用 Gradio 定义聊天机器人块:

    with gr.Blocks() as demo:
        chatbot = gr.Chatbot(
            [[None, ("Hi, I am awesome-tiny-sd, a little stable diffusion model that lets you generate images:blush:\nJust write me a prompt, I'll generate what you ask for:heart:",)]], ## the first argument is the chat history
            label="awesome-tiny-sd",
            elem_id="chatbot",
            bubble_full_width=False,
        ) ## this is the base chatbot architecture
    
        chat_input = gr.MultimodalTextbox(interactive=True, file_types=["png","jpg","jpeg"], placeholder="Enter your image-generating prompt...", show_label=False) ## types of supported input
    
        chat_msg = chat_input.submit(add_message, [chatbot, chat_input], [chatbot, chat_input]) ## receive a message
        bot_msg = chat_msg.then(bot, chatbot, chatbot, api_name="bot_response") ## send a message
        bot_msg.then(lambda: gr.MultimodalTextbox(interactive=True), None, [chat_input])
    
        chatbot.like(print_like_dislike, None, None)
        clear = gr.ClearButton(chatbot) ## show clear button
    
  • 启动机器人

    demo.queue()
    if __name__ == "__main__":
        demo.launch(server_name="0.0.0.0", share=False)
    
  • 执行脚本

    python3 app.py
    

现在等着机器人启动成功,一单 stable diffusion 通道加载成功,聊天机器人应该在 localhost:7860(或类似 Linux 的操作系统为 0.0.0.0:7860)上运行。

小结

今天我们学习了通过stable diffusion模型构建对话机器人来生成图像信息,你可以通过 awesome-tiny-sd直接运行你的对话机器人来生成图像,您将使用 awesome-tiny-sd 生成的第一张图像是什么?请在下面的评论中告诉我

其他

线上体验地址:Hugging Face:https://huggingface.co/spaces/as-cle-bert/awesome-tiny-sd

您可以下载awesome-tiny-sd Docker镜像并通过容器运行它:

docker pull ghcr.io/astrabert/awesome-tiny-sd:latest
docker run -p 7860:7860 ghcr.io/astrabert/awesome-tiny-sd:latest
目录
相关文章
|
1月前
|
存储 安全 机器人
MemoryScope:为LLM聊天机器人配备的长期记忆系统
如何选择合适的方法构建自己的智能体助理呢?这里向您介绍强大、低延迟、安全可控的MemoryScope开源项目。
|
6月前
|
机器学习/深度学习 自然语言处理 搜索推荐
【大模型】LLM与传统聊天机器人的区别是什么?
【5月更文挑战第4天】【大模型】LLM与传统聊天机器人的区别是什么?
|
SQL 弹性计算 自然语言处理
AIGC-知识库-LLM:在云上从0开始搭建智能问答机器人Streamlit网页版
本文描述在阿里云上从0开始构建个人/企业专属,具备私域知识库+LLM智能问答能力的网页版聊天机器人。网页采用streamlit实现,知识库技术方案使用了Lindorm AI数据服务平台知识库能力,LLM使用了开源ChatGLM2-6B。 Streamlit使用起来非常简便,可以让开发者快速(短则几十分钟即可)搭建一个具备公网访问能力的网页。尤其在人工智能开发上,可使用Streamlit快速搭建应用环境,让开发人员将更多精力集中在人工智能本身,本文从0开始详细讲解整个应用的构建过程,代码实现了一个简洁的具备公网访问能力的网页版聊天机器人。
|
SQL 弹性计算 自然语言处理
AIGC-知识库-LLM:从0开始搭建智能问答钉钉机器人
本文描述在阿里云上从0开始构建个人/企业专属,具备私域知识库+LLM智能问答钉钉机器人。知识库技术方案使用了Lindorm AI数据服务平台知识库能力,LLM使用了开源ChatGLM2-6B。
1097 1
|
机器学习/深度学习 JSON 人工智能
LLM 系列 | 10: 如何用ChatGPT构建点餐机器人?
今天这篇小作文主要介绍如何用ChatGPT构建一个定制化的闲聊机器人和订餐机器人。
|
机器学习/深度学习 人工智能 算法
将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水
将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水
110 0
|
机器学习/深度学习 算法 机器人
Interview:算法岗位面试—11.07早上上海某机器人公司(上市)面试之项目考察、比赛考察、图像算法的考察等
Interview:算法岗位面试—11.07早上上海某机器人公司(上市)面试之项目考察、比赛考察、图像算法的考察等
|
6月前
|
传感器 人工智能 监控
智能耕耘机器人
智能耕耘机器人
136 3
|
10天前
|
机器学习/深度学习 传感器 算法
智能机器人在工业自动化中的应用与前景###
本文探讨了智能机器人在工业自动化领域的最新应用,包括其在制造业中的集成、操作灵活性和成本效益等方面的优势。通过分析当前技术趋势和案例研究,预测了智能机器人未来的发展方向及其对工业生产模式的潜在影响。 ###
42 9
|
7天前
|
机器人 人机交互 语音技术
智能电销机器人源码部署安装好后怎么运行
销售打电销,其中90%电销都是无效的,都是不接,不要等被浪费了这些的精力,都属于忙于筛选意向客户,大量的人工时间都耗费在此了。那么,有这种新型的科技产品,能为你替代这些基本的工作,能为你提升10倍的电销效果。人们都在关心智能语音客服机器人如何高效率工作的问题,今天就为大家简单的介绍下:1、智能筛选系统:电销机器人目前已经达到一个真人式的专家级的销售沟通水平,可以跟客户沟通,筛选意向,记录语音和文字通话记录,快速帮助电销企业筛选意向客户,大大的节约了筛选时间成本和人工成本。2、高速运转:在工作效率上,人工电销员,肯定跟不上智能语音机器人,机器人自动拨出电话,跟客户交谈。电话机
79 0

热门文章

最新文章