SPO来袭:Prompt工程师90%不存在了?AI自动优化时代开启!

简介: 当你点进这个标题时内心是怎样复杂的心情,质疑,鄙夷,或者是惊讶?这也正是我们最初点开这篇论文时的心情。然而, 在完成项目测试后, 我们瘫坐在椅子上, 默默打下了 'Prompt工程师,不存在' 这几个

01.引言

当你点进这个标题时内心是怎样复杂的心情,质疑,鄙夷,或者是惊讶?这也正是我们最初点开这篇论文时的心情。然而, 在完成项目测试后, 我们瘫坐在椅子上, 默默打下了 'Prompt工程师,不存在' 这几个字。或者更准确地说,也许90%的 Prompt工程师 职位, 可能都不存在了。

一直以来,学术与实际产品的Prompt完全脱节,真实场景下,很多产品都聚焦情感陪伴,文案生成等开放任务里。而学术上这些任务没有明确的指标,无法量化也就没办法被比较,于是绝大部分的Prompt优化工作都聚焦在“刷榜”,例如怎么提升一个模型的代码/数学能力。但对于我们大众来说,根本不关心这些,因为这些并不是我们的需求。另一个原因,传统的Prompt优化的工作大多都要很多很多数据集,可真实场景里哪里能拿到那么多数据,大部分时候能有5个好的案例就已经很多了。

诶?主播主播,那么有没有一个项目可以既不用很多标注的数据,又有很好的效果,又可以优化开放任务,又可以优化推理任务呢?

有的兄弟,有的

我们今天跑的项目叫SPO,具体什么意思并不重要,重要的是它把之前的所有问题全部解决了。

只有3个案例可以参考?

没问题的兄弟,没有案例参考都可以自动优化。

你想做情感陪伴?

没问题,想要什么风格的女朋友都可以。

不会写爆款文案?

只需提供几个参考,立刻为你量身定制创作指令。

还没有想好最后要什么效果?

没关系,自动优化到你满意为止,这次你来当甲方爸爸,挑选自己喜欢的就行。

担心优化Prompt太花钱?

整个优化流程成本不到1块钱,人民币!

害怕优化耗时太久?

五分钟就可完成优化,全程无尿点。

以上我说的这些都没有在夸大,我想是时候让我们重新定义Prompt Engineer了,或许Prompt Engineer并非不存在了,而是会因为这个项目以更高效的形式进化了。

02.效果

废话不多说,我们觉得最直接的方式是直接展示他们这个项目的效果。我们测试了“R1的回答能力模仿”,“小红书文案模仿”,“女友扮演”这几个大家最关注的方面,分别在GPT-4o-mini和Deepseek-v3上做了测试,我们发现几乎只需要五分钟的自动优化,就可以达到业内顶尖的Prompt效果,所有实验我们都录制了完整的一镜到底的视频,放在“完整实验过程”的部分。

案例1:深度思考

我们发现很多小伙伴很喜欢R1说的一些非常有哲理的话,以及非常好的写作技巧,于是我们尝试用这个项目提升GPT-4o-mini上回答的哲理性。为什么这里没有用Deepseek-v3呢?毕竟一家公司的,需要避嫌一下,万一偷看答案了呢

初始的Prompt我们设置为下面这个进行迭代和对比

尽可能多思考,给出最好的答案。使用<think></think>和<answer></answer>封装思考和回答。

这是SPO最后优化出的Prompt

我们在不同问题上进行了测试(由于篇幅有限,故仅展示Answer部分进行对比)

问题1:你觉得AI是否有思想?

问题2:你觉得人生的意义是什么?

问题3:你觉得AI会超过人类吗?

案例2:女友扮演

大部分小伙伴另一个需求是和AI谈恋爱,但通常AI的回答比较死板,各个平台的角色又不一定能完全满足我们的需求,如果可以定制化一些,且快速地得到一个女友Prompt就好了。我们这里使用Deepseek-V3进行测试

初始的Prompt我们设置为下面这个进行迭代和对比

扮演我的女朋友。

这是SPO最后优化出的Prompt

问题1:你爱我吗?

问题2:放假想去哪里玩呀?

问题3:我今天不开心

案例3:小红书文案

除了单纯的娱乐,我们发现这个项目也可以服务于营销文案/宣传文案等商业需求上,例如帮忙写小红书文案。

在这里我们选择展示在小红书的旅游话题上进行文案风格复刻,实际使用时参考我们视频中的方法几乎可以复刻任何类型的小红书。为了给大家展示整个过程有多快和方便,这个案例中我们从空模板开始从0填写。具体演示可以在“完整实验过程”这个章节找到。

初始的Prompt我们设置为下面这个进行迭代和对比

根据主题写小红书文案。

这是SPO最后优化出的Prompt

问题1:去成都旅游优化前

优化后

问题2:去新加坡旅游优化前

优化后

需要注意,这里所有的格式均为原始输出格式,例如标题级别,加粗,小标题等都为原始输出附带。其中SPO优化后的图片为原始输出附带的拍摄照片描述和留空图片位置,我们从互联网找到相似图片进行替代。

03.完整实验过程

为了填上文章开头的坑,我们并没有在标题党。这个部分我们放上了从0开始优化出Prompt的一镜到底视频,给大家看到整个过程,也能作为使用时的参考。

案例1:深度思考

https://live.csdn.net/v/464328

案例2:女友扮演

https://live.csdn.net/v/464329

案例3:小红书文案

https://live.csdn.net/v/464330

04.使用

很多小伙伴看到这里已经等不及想用一下看看,目前大家可以直接阅读他们的论文和使用他们的代码,项目完全开源。

代码:

https://github.com/geekan/MetaGPT/tree/main/examples/spo

论文:

https://arxiv.org/pdf/2502.06855

添加图片注释,不超过 140 字(可选)

我们也注意到,作者还部署了在线版可以直接玩(不过线上版本不太稳定,建议有条件的小伙伴可以本地部署体验完整版,并且在线版无法体验完整的模型,效果无法达到最佳)

Hugging Face 链接:

https://huggingface.co/spaces/XiangJinYu/SPO

作者也与国内的ModelScope魔搭社区官方进行了合作,现在可以体验由Deepseek-V3和Qwen-2.5-72B等开源模型驱动的SPO。

ModelScope 链接:

https://modelscope.cn/studios/AI-ModelScope/SPO

05.作者介绍

SPO 作者团队来自于 MetaGPT 开源社区。SPO 论文共同第一作者为 DeepWisdom 研究员向劲宇 和 香港科技大学(广州)的博士生张佳钇,共同通讯作者为 DeepWisdom 创始人兼 CEO 吴承霖(MetaGPT 代码作者、论文通讯作者)和香港科技大学(广州)的助理教授骆昱宇。作者还包括 DeepWisdom 研究员于兆洋,DeepWisdom 研究员梁新兵,中国人民大学的滕枫蔚,独立研究员涂津豪, DeepWisdom 研究员洪思睿(MetaGPT 论文共同一作)。

值得一提的是, SPO 的团队几乎是 AFlow 原班人马,而就在二月份, AFlow 入选了 ICLR 2025 AI顶会的 Oral (前 1.8%)。AFlow 展示了Workflow的自动优化的可能性,而如今SPO实现了绝大部分真实场景下的 Prompt 自动优化,相信接下来这个国内的团队还会带给我们更多的惊喜。

点击链接,即可跳转体验~

让提示词自我进化

目录
相关文章
|
5月前
|
人工智能 安全 架构师
不只是聊天:从提示词工程看AI助手的优化策略
不只是聊天:从提示词工程看AI助手的优化策略
408 119
|
5月前
|
人工智能 IDE Java
AI Coding实践:CodeFuse + prompt 从系分到代码
在蚂蚁国际信贷业务系统建设过程中,技术团队始终面临双重考验:一方面需应对日益加速的需求迭代周期,满足严苛的代码质量规范与金融安全合规要求;另一方面,跨地域研发团队的协同效率与代码标准统一性,在传统开发模式下逐渐显现瓶颈。为突破效率制约、提升交付质量,我们积极探索人工智能辅助代码生成技术(AI Coding)的应用实践。本文基于蚂蚁国际信贷技术团队近期的实际项目经验,梳理AI辅助开发在金融级系统快速迭代场景中的实施要点并分享阶段性实践心得。
1245 25
AI Coding实践:CodeFuse + prompt 从系分到代码
|
5月前
|
人工智能 缓存 并行计算
用数学重构 AI的设想:流形注意力 + 自然梯度优化的最小可行落地
本文提出两个数学驱动的AI模块:流形感知注意力(D-Attention)与自然梯度优化器(NGD-Opt)。前者基于热核偏置,在局部邻域引入流形结构,降低计算开销;后者在黎曼流形上进行二阶优化,仅对线性层低频更新前置条件。二者均提供可复现代码与验证路径,兼顾性能与工程可行性,助力几何感知的模型设计与训练。
469 1
|
5月前
|
存储 人工智能 搜索推荐
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
本文介绍基于LangGraph构建的双层记忆系统,通过短期与长期记忆协同,实现AI代理的持续学习。短期记忆管理会话内上下文,长期记忆跨会话存储用户偏好与决策,结合人机协作反馈循环,动态更新提示词,使代理具备个性化响应与行为进化能力。
982 10
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
|
人工智能 搜索推荐 JavaScript
【Geo专家于磊】深度解析:Geo优化中的Schema标签,如何让你的内容在AI时代脱颖而出?
微笑老师详解Geo优化中Schema标签的写法,揭示如何通过结构化数据提升AI时代下的内容可见性。从选择类型、填写关键属性到JSON-LD格式应用与测试验证,全面掌握Geo优化核心技巧,助力本地商家在搜索结果中脱颖而出。(238字)
556 0
|
5月前
|
人工智能 自然语言处理 算法
AISEO咋做?2025年用AI优化SEO和GEO 的步骤
AISEO是AI与SEO结合的优化技术,通过人工智能生成关键词、标题、内容等,提升网站排名。它支持多语言、自动化创作,并利用高权重平台发布内容,让AI搜索更易抓取引用,实现品牌曝光与流量增长。
|
5月前
|
存储 机器学习/深度学习 人工智能
构建AI智能体:三、Prompt提示词工程:几句话让AI秒懂你心
本文深入浅出地讲解Prompt原理及其与大模型的关系,系统介绍Prompt的核心要素、编写原则与应用场景,帮助用户通过精准指令提升AI交互效率,释放大模型潜能。
1002 6
|
5月前
|
数据采集 人工智能 程序员
PHP 程序员如何为 AI 浏览器(如 ChatGPT Atlas)优化网站
OpenAI推出ChatGPT Atlas,标志AI浏览器新方向。虽未颠覆现有格局,但为开发者带来新机遇。PHP建站者需关注AI爬虫抓取特性,优化技术结构(如SSR、Schema标记)、提升内容可读性与语义清晰度,并考虑未来agent调用能力。通过robots.txt授权、结构化数据、内容集群与性能优化,提升网站在AI搜索中的可见性与引用机会,提前布局AI驱动的流量新格局。
287 8
|
5月前
|
人工智能 运维 定位技术
【微笑讲堂】AI时代的Geo优化:掌握这些技能,让你的内容被智能引擎“偏爱”
大家好,我是微笑老师!本期讲解“Geo都需要掌握哪些技能”。随着AI搜索兴起,GEO(生成式引擎优化)正取代传统SEO,核心在于让内容被AI“读懂、信任、引用”。需掌握四大技能:结构化数据工程、多模态语义对齐、动态知识图谱运维、权威信源建设。从“被找到”到“被引用”,GEO与SEO融合进化,助力内容在AI时代脱颖而出。未来已来,你准备好了吗?
808 8

热门文章

最新文章