令人兴奋的 Dall-E3 即将到来

简介: 令人兴奋的 Dall-E3 即将到来

image.png

经过10个月左右的沉寂,OpenAI 终于即将要发布 Dall-E3,这是其 AI 图像生成器的最新版本。据说 Dall-E3 比 Dall-E2 有明显的改进升级,具有更多细微差别和细节。

Dall-E3 有什么新功能?

  • 更好的图像质量和一致性
  • Dall-E3 可以生成文本
  • Dall-E3 集成在 ChatGPT 中
  • Dall-E3 创建的图像版权归用户

据说目前的版本可供约 400 个用户使用,超越了 OpenAI 的先前模型以及公认的竞争对手,例如 Midjourney 或者 Stable Diffusion XL。

更好的图像质量和一致性

和 Dall-E2 相比,Dall-E3 有更好的图像质量和一致性。

为了更好地说明其差异,来看看下面的示例。两个图像使用相同的提示(提示还是以英文为主)。

Prompt: A paper craft art depicting a girl giving her cat a gentle hug. Both sit amidst potted plants, with the cat purring contentedly while the girl smiles. The scene is adorned with handcrafted paper flowers and leaves.

image.png

这个例子展示了 Dall-E3 理解和生成复杂概念的能力。除此之外,注意到右图中的女孩既没有微笑也没有拥抱猫。

Dall-E3 可以生成文本

另一个重要的更新是能够正确、清晰地拼写单词。例如,可以使用 Dall-E3 生成复古的旅行海报:

Prompt: A vintage travel poster for Venus in portrait orientation. The scene portrays the thick, yellowish clouds of Venus with a silhouette of a vintage rocket ship approaching. Mysterious shapes hint at mountains and valleys below the clouds. The bottom text reads, ‘Explore Venus: Beauty Behind the Mist’. The color scheme consists of golds, yellows, and soft oranges, evoking a sense of wonder.

image.png

这个实例 AI 根据海报风格选择其理解的字体和颜色以匹配海报的整体美感,这一点是其他人工智能工具无法做到的。

集成在 ChatGPT 中

从 2023 年 10 月开始,ChatGPT Plus 订阅者将能够在 ChatGPT 中本地使用  Dall-E3 。这意味着可以使用 ChatGPT 生成或完善  Dall-E3 的提示,只需询问想查看什么即可。

ChatGPT Plus 还允许访问最新的语言模型、GPT-4 和 ChatGPT 插件,有条件的可以开通尝试。

image.png

它将于今年秋天晚些时候在 OpenAI Labs 上推出。

图像版权归用户

使用 Dall-E3 创建的图像可供您使用、重印、出售或商品化。

根据内容政策和条款,您拥有使用 DALL·E 创建的图像,包括转载、销售和商品化的权利 - 无论图像是通过免费还是付费信用生成的。

比 MidJourney 好吗?

MidJourney AI 长期以来被认为是最好的 AI 图像生成器。然而,Dall-E3 生成的图像质量是相当的,这两种工具目前处于激烈的竞争之中。

下面来看一个示例,当然这个示例不能代表所有,每个工具对于不同用户的喜好程度是不一样的。

Prompt: A vibrant yellow banana-shaped couch sits in a cozy living room, its curve cradling a pile of colorful cushions. on the wooden floor, a patterned rug adds a touch of eclectic charm, and a potted plant sits in the corner, reaching towards the sunlight filtering through the window. 提示:舒适的客厅里摆放着一张充满活力的黄色香蕉形沙发,其曲线支撑着一堆色彩缤纷的靠垫。木地板上,有图案的地毯增添了一丝不拘一格的魅力,一盆盆栽坐落在角落里,迎向透过窗户的阳光。

image.png

从上面的结果来看,其实跟现实中的两个人类似,不同的理解而已,效果都相当惊人。

总结

Dall-E3 目前尚未公开,但其结果的早期效果令人印象深刻。如果事实证明它比 MidJourney 更好,相信很多人愿意取消MidJourney 订阅并在 ChatGPT 上使用 Dall-E3。

译自:medium.com/generative-…


相关文章
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
【AI系统】大模型的到来
大模型的兴起,让系统工程师能在前所未有的集群规模上解决复杂工程问题,显著降低成本和时间。本文探讨了大模型的发展历程、技术架构、支持模态及应用领域,特别分析了AI系统与AI基础设施的区别及其对大模型的影响。随着大模型进入爆发期,AI系统的重要性日益凸显,不仅影响着算法的选择与发展,也成为推动大模型研究与应用的关键力量。
54 0
|
7月前
|
机器学习/深度学习 数据采集 人工智能
没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰
【5月更文挑战第29天】生成式AI论文引发关注,提出无指数级数据增长或致其发展达顶峰。依赖大量数据的生成式AI可能已遇瓶颈,零样本学习能力受限。尽管有挑战,但研究建议关注数据质量、探索新算法及跨领域应用,同时应对环境、伦理问题。[论文链接](https://arxiv.org/pdf/2404.04125)
83 5
|
4月前
|
人工智能
最近很火的人工智能ChatGPT可以实现“ 连续对话”机制
这篇文章介绍了人工智能ChatGPT实现连续对话机制的方法,包括如何通过传递特定的参数如conversation_id来保持对话的连续性。
最近很火的人工智能ChatGPT可以实现“ 连续对话”机制
|
7月前
|
机器学习/深度学习 人工智能
超越Sora极限,120秒超长AI视频模型诞生!
【5月更文挑战第1天】 StreamingT2V技术突破AI视频生成界限,实现120秒超长连贯视频,超越Sora等传统模型。采用自回归方法,结合短期记忆的条件注意模块和长期记忆的外观保持模块,保证内容连贯性和动态性。在实际应用中,展示出优秀的动态性、连贯性和图像质量,但仍有优化空间,如处理复杂场景变化和连续性问题。[链接](https://arxiv.org/abs/2403.14773)
92 3
|
人工智能 数据安全/隐私保护 异构计算
用AI唤醒老照片里的记忆(GPU版)
只需选取一张老照片,即可一键修复,用AI唤醒老照片里的记忆。
|
机器学习/深度学习 存储 人工智能
英伟达把GPT-4塞进我的世界,打游戏快15倍:AI大佬沉默了
英伟达把GPT-4塞进我的世界,打游戏快15倍:AI大佬沉默了
165 0
|
机器学习/深度学习 人工智能 算法
ChatGPT唤醒AI游戏?
ChatGPT唤醒AI游戏?
168 0
|
机器学习/深度学习 人工智能 算法
OpenAI CEO:巨型AI模型时代已结束,马斯克TruthGPT曝光
OpenAI CEO:巨型AI模型时代已结束,马斯克TruthGPT曝光
131 0
|
机器学习/深度学习 人工智能 计算机视觉
Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了(1)
Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了
|
计算机视觉
Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了(2)
Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了
下一篇
DataWorks