给张图就能反推Prompt,AI绘画神器Midjourney能够「看图说话」了

简介: 给张图就能反推Prompt,AI绘画神器Midjourney能够「看图说话」了


AI 反推出来的 prompt,会比人类手写的更好吗?


在各种 AIGC 产品层出不穷的今天,让 AI 画一张图已经不是什么难事。

尽管有着「无需动笔」、「零门槛作画」等一系列优点,但很多人并不能借助 AI 之手轻松获得一幅理想中的作品 —— 难点在于「prompt」。

Prompt 方法是一门极深的管理学问:如果不输入精准的命令描述,生成结果就可能十分随机,甚至与预期相去甚远。但归根结底,如何给出完美的 prompt,如何让模型按照人类用户预设的方式输出结果,甚至如何降低花在 prompt 上的成本,很少有人清楚。

正因此,AIGC 产业衍生出了一种专门的职业 ——prompt 工程师。前段时间,初创公司 Anthropic 在旧金山招聘「prompt 工程师和图书馆员」,给出的薪水高达 33.5 万美元。

或许,这一过程也能让 AI 代劳呢?AI 会做的比人类更好吗?

最近,AI 绘画神器 Midjourney 就上新了一个功能:/describe。

「今天,我们发布了一个 /describe 命令,可让您将图像转换为文字。」

具体来说,Midjourney 学会了从图像中反推 prompt。如果你在 Midjourney 上传一张图片,它会提供给四个版本的描述,你可以直接拿来并进行调整,然后去生成自己想要的图片变体。

Midjourney 是一款 2022 年 3 月发布的 AI 绘画工具,此前刚刚推出第五代版本,由于生成效果十分「炸裂,大量用户迅速涌入,以至于该公司不得不关闭了免费注册通道。

这一次功能的更新意义重大:

  • 改进可访问性:通过用于 Web 显示的 ALT 文本元素,图像描述让有视觉障碍或阅读困难的人更容易访问数字内容;
  • 增强的可搜索性:描述可以通过搜索引擎启用更好的搜索功能和索引;
  • 用于标题:可以包含描述,使图像更加清晰;
  • 详细 prompt:描述可用于创建更详细的 prompt 以制作新变体,可以为快速工程提供灵感。


怎么使用?

用户只需从写一个「 /describe」开始,Midjourney 提供了上传图像的位置:

上传图片后,点击进入:

然后,Midjourney 根据图像返回四个描述:

底部的四个数字是混合按钮,每个数字都与相应的描述相匹配。单击数字,Midjourney 会根据新的描述重新混合图像。

你也可以混合修改 prompt:

这是创建示例图像的原始 prompt:

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors(一幅有树根的大脑图像,迷幻艺术,充满活力,作者 Alex Grey,作者 Amanda Sage,作者 Robert Venosa,霓虹颜色)


这是 Midjourney 描述的 prompt 之一,被用于混合:

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts(一幅有树根的抽象大脑树图像,马克・亨森的风格,明亮的色彩,黑暗的象征主义,详细的解剖学,大胆的线条,鲜艳的色彩,心理现象的插图,千鸟格的木刻)


新的生成结果如下:

试用体验

该功能一经发布,就吸引了各位 AI 绘画爱好者的注意,很多人立马就上手开始创作了。

以下是通过一张 NASA 登月任务宇航员照片生成的新图片(右),的确以假乱真:

下图(左)为原图,(右)为 /describe 之后生成的新结果:

还有人想到,可以用 /describe 来进行品牌 logo 的升级。如此一来,既可以延续此前的品牌辨识度,又带来了全新的形象。

星巴克的「新 logo」毫无违和感。

苹果公司的经典标志,也可以是五彩缤纷的:

这是阿迪达斯:

百事公司可以考虑以下这款新设计:

不管是「文生图」还是「图生文」,随着用户交互的增加,MidJourney 的效果必然会有所提升。有研究者猜测,MidJourney 一直在进行大规模的人类反馈强化学习(RLHF),而这可能是有史以来规模最大的文字转图像。拥有的用户越多,MidJourney 能做的 RLHF 就越好,然后获得的用户会变得更多。


参考链接:https://medium.com/the-generator/midjourneys-crazy-new-describe-feature-a96cc09203cc

相关文章
|
28天前
|
人工智能 语音技术
通义语音AI技术问题之正则化DINO框架在说话人识别任务领域的应用如何解决
通义语音AI技术问题之正则化DINO框架在说话人识别任务领域的应用如何解决
17 0
|
11天前
|
人工智能 计算机视觉 Python
AI计算机视觉笔记八:基于mediapipe的虚拟绘画
该项目利用MediaPipe手部关键点识别技术,实现了隔空绘画功能。用户可以通过手势控制绘画工具,选择颜色或橡皮擦。环境配置基于`mediapipe_env`,在PyCharm中运行。项目包括两个文件:`AiVirtualPainter.py`负责绘画逻辑,`HandTrackingModule.py`用于手部关键点检测。此项目展示了AI技术在互动应用中的潜力,适合初学者实践与学习。
31 10
|
6天前
|
人工智能 搜索推荐 UED
Bot 商店 + 一键优化提示词 Prompt,开启AI新体验!| Botnow上新
Botnow 迎来了重大更新,新增了 Bot 商店功能,并优化了 Bot 编排,提升了 AI 使用效率。用户可在 Bot 商店中轻松浏览和体验各类官方及用户发布的 Bots,并可一键发布或下架自己的 Bot。此外,还推出了一键优化 Prompt 功能,帮助用户生成清晰、精准的指令,提升对话质量。新老用户快来体验吧![链接]
30 4
|
17天前
|
存储 人工智能 搜索推荐
AI 网关基于 IP 地理位置,增强 Prompt 修饰能力
本⽂对 Prompt 的使用方式进行了简单介绍,让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息,实现 LLM 的个性化回复,提升问答的准确度。
|
28天前
|
人工智能 数据挖掘 语音技术
通义语音AI技术问题之说话人识别的两种类型分类如何解决
通义语音AI技术问题之说话人识别的两种类型分类如何解决
39 5
|
1月前
|
人工智能 数据处理 Python
🔍数据侦探的AI助手:Prompt技巧大公开,洞察商业先机不手软
【8月更文挑战第1天】在数据驱动时代,AI助手作为数据侦探的强大伙伴,通过精心设计的AI Prompt技巧帮助解析复杂市场。案例中,一电商平台欲进入新兴市场,面临数据挑战。初始Prompt聚焦消费者偏好及影响因素分析。为进一步深化洞察,Prompt加入节假日购物模式、商品类别偏好及社交媒体影响等细节。结合领域知识,优化Prompt关注价格敏感度与定制化营销策略。最终,AI助手生成的报告揭示了消费者行为模式,并提出市场策略建议,助力电商成功布局新兴市场。此过程展示了AI Prompt在商业洞察中的关键作用,预示着其在未来洞察之旅中的广阔前景。
30 2
|
1月前
|
人工智能 数据挖掘 Python
💡灵感爆发!AI Prompt创意引导,让商业数据分析报告也能讲故事
【8月更文挑战第1天】在商业领域, 数据分析报告常被视为枯燥的数据堆砌。但AI技术, 尤其是AI Prompt的创意引导功能, 正革新数据呈现方式。传统报告重准确性轻生动性; 而AI Prompt创意引导下的报告则如电影般, 通过故事化叙述使复杂洞察变得生动有趣。例如分析电商平台季节性销售时, AI Prompt可以生成主题为“穿越四季购物之旅”的创意指令, 将数据编织成引人入胜的故事篇章, 使读者不仅能获取商业洞察, 更能感受到数据背后的情感与温度, 大大提升报告的吸引力和传播力。这标志着数据分析报告新时代的到来。
47 0
|
1月前
|
人工智能 自然语言处理 数据可视化
🚀从零到英雄!AI Prompt赋能商业数据分析,新手也能成专家
【8月更文挑战第1天】在数字化时代,商业数据分析至关重要但门槛高。AI Prompt技术革新了这一领域,使新手能迅速成为专家。AI Prompt通过自然语言指令驱动AI执行数据分析任务,无需编程背景即可享受数据洞察。例如,新分析师可通过简单指令分析销售数据,计算关键指标并生成可视化报告。随着技能提升,可设计更复杂的指令满足多样需求。AI Prompt还能自我学习优化,提高分析质量和效率。总之,这项技术简化了数据分析流程,加速了人才的成长路径。
98 0
|
1月前
|
人工智能 自然语言处理 数据挖掘
💼职场晋升神器!掌握AI Prompt,让你的商业数据分析能力秒杀同事
【8月更文挑战第1天】在职场竞争中,如何利用AI Prompt提升商业数据分析能力以加速晋升? **Q1**: AI Prompt通过自然语言指令简化数据分析流程,非技术人员也能高效挖掘商业洞察。**Q2**: 掌握AI Prompt需熟悉NLP基础知识并通过实践案例学习应用技巧。**Q3**: 相比传统方法,AI Prompt能即时处理数据,发现深层洞察,并随使用优化。**Q4**: 持续学习新技术,实践中解决问题,分享经验,并展示成果,以此在职场中脱颖而出。掌握AI Prompt,开启职场新篇章!
30 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
🔬技术宅必看!AI Prompt深度解析,商业数据分析的科学魔法
【8月更文挑战第1天】在快速发展的科技领域中, AI Prompt 正革新商业数据分析方式。它通过自然语言指令, 驱动 AI 模型实现数据洞察。本文探讨 AI Prompt 的定义、原理及其在商业分析中的应用。**最佳实践包括**: 精准设计 Prompt 以确保清晰具体的指令; 结合领域知识优化 Prompt, 提升分析准确性; 采用迭代法, 根据反馈持续改进模型性能。掌握 AI Prompt 技术, 不仅提高效率, 更能洞察商机, 创造价值。
62 0