AI 提示词模板相关的架构设计

2024-05-29 1587

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 现在很多企业纷纷研发大语言模型以解决业务问题。提示词在与模型交互中起到关键作用。为优化提示词模板的修改、提高渲染效率及确保安全性，架构设计注重可修改性、安全性、可靠性和性能。设计包括：将提示词存储在OSS以方便修改和版本控制；使用本地缓存提升读取性能；模板引擎增强灵活性；秘钥安全存储在加密系统中；并通过配置中心动态调整。此设计旨在提供高效、安全且可靠的AI交互体验等。

一、前言

去年 GPT-3.5 的问世，让很多国内外企业看到了大模型的强大能力和巨大价值，都在纷纷自研自己的大语言模型或者探索如何将大语言模型应用到解决业务难题、提高工作和生产效率上来。

现在，我们通过自然语言编写提示词就可以和大语言模型进行交互，实现自己想要的功能。提示词对大语言模型的性能和输出质量起着至关重要的作用。
AI提示词模板架构设计.png

在实际的 AI 业务落地过程中，提示词通常需要经历多轮调优，而且在调用大语言模型之前，通常需要动态构造提示词。如何让提示词模板更易于修改，如何让提示词模板渲染的效率更高，如何避免提示词的误修改对线上程序产生负面影响很关键。

二、架构设计考量

基于上述背景，在做架构设计时，我们重点考虑以下几个软件质量属性：

1 可修改性 。可修改性是指能够快速地以较高的性能价格比对系统进行变更的能力。由于提示词需要多轮调优，上线以后经常需要根据 Bad Case 不断优化提示词，因此需要采用更易于修改的方式。
2 安全性。安全性是指系统向合法用户提供服务的同时能够阻止非授权用户使用的企图或拒绝服务的能力。如果提示词模板需要存储在云端，需要通过鉴权进行访问，那么秘钥的安全存储非常关键。良好的安全性可以避免秘钥泄露，从而对系统安全造成负面影响。
3 可靠性。 可靠性是指系统能够处理错误和异常情况，并继续运行或安全地停机。通过合理的错误处理机制和冗余设计，系统能够避免单点故障导致的整体崩溃。在设计软件架构时，我们还应该考虑可靠性，任何在预发布环境中发现的问题都可以在不影响生产系统的情况下进行修复，从而减少了线上环境出现问题的概率，提高了系统的可靠性。
4 性能。性能是指系统的响应能力，处理任务所需时间或单位时间内的处理量。如果提示词模板存储在远端，提示词模板的读取性能也很重要，高性能达成良好的用户体验的关键因素。