AI 提示词模板相关的架构设计

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
简介: 现在很多企业纷纷研发大语言模型以解决业务问题。提示词在与模型交互中起到关键作用。为优化提示词模板的修改、提高渲染效率及确保安全性,架构设计注重可修改性、安全性、可靠性和性能。设计包括:将提示词存储在OSS以方便修改和版本控制;使用本地缓存提升读取性能;模板引擎增强灵活性;秘钥安全存储在加密系统中;并通过配置中心动态调整。此设计旨在提供高效、安全且可靠的AI交互体验等。

一、前言

去年 GPT-3.5 的问世,让很多国内外企业看到了大模型的强大能力和巨大价值,都在纷纷自研自己的大语言模型或者探索如何将大语言模型应用到解决业务难题、提高工作和生产效率上来。

现在,我们通过自然语言编写提示词就可以和大语言模型进行交互,实现自己想要的功能。提示词对大语言模型的性能和输出质量起着至关重要的作用。
AI提示词模板架构设计.png

在实际的 AI 业务落地过程中,提示词通常需要经历多轮调优,而且在调用大语言模型之前,通常需要动态构造提示词。如何让提示词模板更易于修改,如何让提示词模板渲染的效率更高,如何避免提示词的误修改对线上程序产生负面影响很关键。

二、架构设计考量

基于上述背景,在做架构设计时,我们重点考虑以下几个软件质量属性:
image.png

1 可修改性 。可修改性是指能够快速地以较高的性能价格比对系统进行变更的能力。由于提示词需要多轮调优,上线以后经常需要根据 Bad Case 不断优化提示词,因此需要采用更易于修改的方式。
2 安全性。安全性是指系统向合法用户提供服务的同时能够阻止非授权用户使用的企图或拒绝服务的能力。如果提示词模板需要存储在云端,需要通过鉴权进行访问,那么秘钥的安全存储非常关键。良好的安全性可以避免秘钥泄露,从而对系统安全造成负面影响。
3 可靠性。 可靠性是指系统能够处理错误和异常情况,并继续运行或安全地停机。通过合理的错误处理机制和冗余设计,系统能够避免单点故障导致的整体崩溃。在设计软件架构时,我们还应该考虑可靠性,任何在预发布环境中发现的问题都可以在不影响生产系统的情况下进行修复,从而减少了线上环境出现问题的概率,提高了系统的可靠性。
4 性能。性能是指系统的响应能力,处理任务所需时间或单位时间内的处理量。如果提示词模板存储在远端,提示词模板的读取性能也很重要,高性能达成良好的用户体验的关键因素。

三、架构设计描述

为了满足上述软件质量属性,如性能、可修改性、安全性、可靠性。设计如下图所示的架构:
Xnip2024-06-16_17-00-11.png

将提示词存储在 OSS 文件中,以便更方便地修改提示词,提高系统的可修改性。可以通过 Git 将不同的版本进行保存,方便分析和恢复到特定版本。

Xnip2024-06-16_16-40-49.png

同时存储在 OSS 中时,可以通过不同的文件夹进行环境区分,可以现在 pre 环境编辑和测试好提示词后再覆盖 gray 和 prod 避免因错误的提示词修改对线上环境造成负面影响,以提高系统的可靠性。

Xnip2024-06-16_17-02-33.png

同时,我们一个提示词可能无法适应所有场景,因此我们可以设计提示词模板路由器,根据不同的情况使用不同的提示词模板。

由于读取提示词模板相对频率较高,为了提高读取提示词模板性能,可以使用本地缓存,对提示词模板进行缓存。

同时,使用 Git 提交提示词时或者 使用 OSS Browser 工具直接修改 OSS 文本时,有 Diff 效果,可以很大程度上避免对提示词的误修改。
Xnip2024-06-16_17-01-04.png

同时为了提高提示词模板的灵活性,我们可以采用模板引擎来编写提示词模板,使用时只需要构造好模板所需的数据进行渲染即可。

在调用 OSS 客户端或者大语言模型时,通常需要在请求头或参数中传入秘钥信息进行鉴权,我们可以将秘钥信息存储在机密信息加密系统中,避免将密钥信息存储在代码仓库中造成秘钥泄露。
4.png

可以在配置中心中配置模板本地缓存的时间,配置当前使用的模型列表等,方便动态调整。
调用大语言模型后,我们可以将相关信息起来用户展示和分析。

四、总结

本文讲述在 AI 应用中常见的 AI 提示词相关的架构设计,该架构设计中重点考虑性能、可修改性、安全性和可靠性,希望对大家能够有帮助。

如果大家想系统学习提示词技巧,可以阅读我的相关文章:《一文掌握大模型提示词技巧:从战略到战术》


如果本文对你有帮助,可以点赞、收藏一下。

麻烦帮我在活动页 的“投稿作品”部分帮我点赞投你的宝贵一票:
image.png

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
相关文章
|
2月前
|
人工智能 前端开发 编译器
【AI系统】LLVM 架构设计和原理
本文介绍了LLVM的诞生背景及其与GCC的区别,重点阐述了LLVM的架构特点,包括其组件独立性、中间表示(IR)的优势及整体架构。通过Clang+LLVM的实际编译案例,展示了从C代码到可执行文件的全过程,突显了LLVM在编译器领域的创新与优势。
150 3
|
23天前
|
人工智能
🎨 设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
AI绘图新时代来临,设计师必备工具——**白盒子AI绘图提示词生成器**助你轻松跨越提示词难题。该工具操作简便,支持中英文切换,涵盖近1000个精选提示词,适用于各种风格创作。无论是新手还是专业设计师,都能大幅提升工作效率,快速实现创意构想。网址:[https://www.baihezi.com/ai-painting-prompt](https://www.baihezi.com/ai-painting-prompt)
108 19
🎨  设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
|
1月前
|
开发框架 前端开发 .NET
一个适用于 .NET 的开源整洁架构项目模板
一个适用于 .NET 的开源整洁架构项目模板
57 26
|
2月前
|
人工智能 Linux API
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
PromptWizard 是微软开源的 AI 提示词自动化优化框架,通过自我演变和自我适应机制,迭代优化提示指令和上下文示例,提升大型语言模型(LLMs)在特定任务中的表现。本文详细介绍了 PromptWizard 的主要功能、技术原理以及如何运行该框架。
240 8
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
|
1月前
|
人工智能 数据安全/隐私保护 图形学
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
60 4
|
1月前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
2月前
|
机器学习/深度学习 人工智能 并行计算
【AI系统】Kernel 层架构
推理引擎的Kernel层负责执行底层数学运算,如矩阵乘法、卷积等,直接影响推理速度与效率。它与Runtime层紧密配合,通过算法优化、内存布局调整、汇编优化及调度优化等手段,实现高性能计算。Kernel层针对不同硬件(如CPU、GPU)进行特定优化,支持NEON、AVX、CUDA等技术,确保在多种平台上高效运行。
121 32
|
2月前
|
存储 机器学习/深度学习 人工智能
【AI系统】计算图优化架构
本文介绍了推理引擎转换中的图优化模块,涵盖算子融合、布局转换、算子替换及内存优化等技术,旨在提升模型推理效率。计算图优化技术通过减少计算冗余、提高计算效率和减少内存占用,显著改善模型在资源受限设备上的运行表现。文中详细探讨了离线优化模块面临的挑战及解决方案,包括结构冗余、精度冗余、算法冗余和读写冗余的处理方法。此外,文章还介绍了ONNX Runtime的图优化机制及其在实际应用中的实现,展示了如何通过图优化提高模型推理性能的具体示例。
76 4
【AI系统】计算图优化架构
|
2月前
|
机器学习/深度学习 存储 人工智能
基于AI的实时监控系统:技术架构与挑战分析
AI视频监控系统利用计算机视觉和深度学习技术,实现实时分析与智能识别,显著提升高风险场所如监狱的安全性。系统架构包括数据采集、预处理、行为分析、实时决策及数据存储层,涵盖高分辨率视频传输、图像增强、目标检测、异常行为识别等关键技术。面对算法优化、实时性和系统集成等挑战,通过数据增强、边缘计算和模块化设计等方法解决。未来,AI技术的进步将进一步提高监控系统的智能化水平和应对复杂安全挑战的能力。
|
2月前
|
存储 人工智能 监控
【AI系统】推理系统架构
本文深入探讨了AI推理系统架构,特别是以NVIDIA Triton Inference Server为核心,涵盖推理、部署、服务化三大环节。Triton通过高性能、可扩展、多框架支持等特点,提供了一站式的模型服务解决方案。文章还介绍了模型预编排、推理引擎、返回与监控等功能,以及自定义Backend开发和模型生命周期管理的最佳实践,如金丝雀发布和回滚策略,旨在帮助构建高效、可靠的AI应用。
202 15