像相机一样变焦、填充画面细节,还能自定义风格,AI作画神器Midjourney又更新了

简介: 像相机一样变焦、填充画面细节,还能自定义风格,AI作画神器Midjourney又更新了



那个大名鼎鼎的 AI 作画神器 Midjourney 又来给用户震撼了,继上个月推出 5.1 版本后,它又很快更新了 5.2 版本。


此次更新包括改进美学风格、生成连贯性、文本理解,并提供提示词分析功能、高变化模式、高分辨率模式。其中最令人心动的是新的「Zoom out」功能,通过 1.5 倍、2 倍以及自定义缩放,将相机拉出,并填充所有侧面细节,达到重构图像的效果



这些新增功能对 Midjourney 文生图的效果怎么样呢?我们一一来看。


首先重点来看「Zoom Out」功能,与 Adobe 的生成式填充工具类似,缩放功能允许用户扩展原始图像,并扩展到更大的范围,同时保留原始图像的细节。


此次 Midjourney 5.2 版本提供了三种缩放选择,分别是 1.5 倍、2 倍以及「1.0 到 2.0」之间的自定义缩放。下图左为原始图像,图右为变焦 2 倍的图像。


图源:MIDJOURNEY/NFT NOW


看到「Zoom Out」功能如此神奇,网友按耐不住纷纷尝试并晒出了自己生成的图像。


图源:推特 @onemeg


两张的效果嫌不够震撼,那就来四张。


图源:推特 @OrctonAI


下面这张图像可能对密恐人士不太友好。


图源:推特 @icreatelife

推特用户 @op7418 更是表示,zoomout 将会是 MJ5.2 的大招,利用它做短视频应该无敌。如下是其使用 zoomout 连续生成多张图片后做的一个短视频。



该用户利用 zoomout 做视频的想法与好多其他用户不谋而合。如下视频中画面不仅能缩小,还能放大。


图源:推特 @nickfloats

其他功能


Midjourney 还提供了「Make Square」功能,将宽高比为 16:9 的长方形图像变成正方形图像。如下图所示。


图源:MIDJOURNEY/NFT NOW


变化模式(Variation Mode)功能允许用户打磨输出图像的细微视觉差别,有高 / 低变化模式两种可选。


下图左为低变化模式,右为高变化模式。


图源:MIDJOURNEY/NFT NOW


另外一个值得关注的新功能是「shorten command」,允许用户对 prompt 进行分析,从而了解哪些单词不会对输出图像产生任何作用,哪些单词是决定输出图像效果的关键。



最后是风格化命令(stylize command)。我们知道,Midjourney 经过训练可以创建具有艺术闪光点和丰富视觉美感的图像,这是它与 Stable Diffusion 等的区别之一。


此次在图像风格化上,用户可以在 prompt 末尾设置 stylize 参数,现在支持的范围是0-1000。下图左没有使用风格化功能,图右为使用了风格化功能,二者的效果显而易见。


图源:推特 @foxtrotfrog


更多 Midjourney 5.2 的详细功能请参考如下:


参考链接:https://nftnow.com/guides/midjourney-5-2-a-guide-to-the-latest-tools-and-features/

相关文章
|
3月前
|
人工智能 开发者
MidJourney 替代品:为什么 FLUX.1 是终极 AI 图像生成工具
MidJourney 是目前流行的 AI 驱动图像生成工具,以其艺术风格和易用性闻名。然而,随着技术进步,其他模型如 FLUX.1、DALL·E 3 和 Stable Diffusion 3 也崭露头角,提供了更多定制选项和高质量输出。其中,FLUX.1 以其开源性质、卓越图像质量和开发者友好性脱颖而出,成为 MidJourney 的有力替代品。选择合适的工具应基于具体需求,FLUX.1 在灵活性和高性能方面表现优异。
|
8月前
|
人工智能 自然语言处理 数据处理
英伟达推出NeMo,极大简化自定义生成式AI开发
【2月更文挑战第30天】英伟达发布NeMo平台,简化生成式AI模型开发,加速AIGC进程。平台提供NeMo Curator、Customizer和Evaluator微服务,覆盖数据准备至模型评估全周期。Curator加速数据处理,Customizer支持模型微调,Evaluator全面评估模型性能。虽有学习曲线挑战,但NeMo为AI创新与应用带来更多可能性。
138 2
英伟达推出NeMo,极大简化自定义生成式AI开发
|
3天前
|
SQL 人工智能 关系型数据库
PolarDB-PG AI最佳实践 2 :PolarDB AI X EAS实现自定义库内模型推理最佳实践
PolarDB通过POLAR_AI插件支持使用SQL调用AI/ML模型,无需专业AI知识或额外部署环境。结合阿里云EAS在线模型服务,可轻松部署自定义模型,在SQL中实现如文本翻译等功能。
|
28天前
|
机器学习/深度学习 存储 人工智能
【AI系统】自定义计算图 IR
本文介绍了模型转换的方法及流程,重点讲解了计算图的自定义方法和优化技术。通过IR(Intermediate Representation)将不同AI框架的模型转换为统一格式,实现跨平台高效部署。计算图由张量和算子构成,支持多种数据类型和内存排布格式,通过算子融合等优化技术提高模型性能。文章还详细说明了如何使用FlatBuffers定义计算图结构,包括张量、算子和网络模型的定义,为自定义神经网络提供了实践指南。
40 3
【AI系统】自定义计算图 IR
|
30天前
|
人工智能 小程序 API
【一步步开发AI运动小程序】十三、自定义一个运动分析器,实现计时计数02
本文介绍如何利用“云智AI运动识别小程序插件”开发AI运动小程序,详细解析了俯卧撑动作的检测规则构建与执行流程,涵盖卧撑和撑卧两个姿态的识别规则,以及如何通过继承`sports.SportBase`类实现运动分析器,适用于小程序开发者。
|
30天前
|
人工智能 小程序 API
【一步步开发AI运动小程序】十二、自定义一个运动分析器,实现计时计数01
随着AI技术的发展,AI运动APP如雨后春笋般涌现,如“乐动力”、“天天跳绳”等,推动了云上运动会、线上健身等热潮。本文将指导你从零开始开发一个AI运动小程序,利用“云智AI运动识别小程序插件”,介绍运动识别原理、计量方式及运动分析器基类的使用,帮助你在小程序中实现运动计时和计数功能。下篇将继续探讨运动姿态检测规则的编写。
|
2月前
|
Web App开发 人工智能 自然语言处理
WebChat:开源的网页内容增强问答 AI 助手,基于 Chrome 扩展的最佳实践开发,支持自定义 API 和本地大模型
WebChat 是一个基于 Chrome 扩展开发的 AI 助手,能够帮助用户理解和分析当前网页的内容,支持自定义 API 和本地大模型。
113 0
|
8月前
|
存储 物联网 Serverless
玩转 AI 绘图,基于函数计算部署 Stable Diffusion可自定义模型
本文主要将带大家通过使用阿里云产品函数计算 FC 和文件存储 NAS ,快速使用 Stable Diffusion 实现更高质量的图像生成,本方案内置模型库+常用插件+ControlNet ,用户可根据自己的需要更换需要的模型、Lora、增加插件。
68862 27
玩转 AI 绘图,基于函数计算部署 Stable Diffusion可自定义模型
|
4月前
|
存储 人工智能 数据可视化
AI计算机视觉笔记二十一:PaddleOCR训练自定义数据集
在完成PaddleOCR环境搭建与测试后,本文档详细介绍如何训练自定义的车牌检测模型。首先,在`PaddleOCR`目录下创建`train_data`文件夹存放数据集,并下载并解压缩车牌数据集。接着,复制并修改配置文件`ch_det_mv3_db_v2.0.yml`以适应训练需求,包括设置模型存储目录、训练可视化选项及数据集路径。随后,下载预训练权重文件并放置于`pretrain_models`目录下,以便进行预测与训练。最后,通过指定命令行参数执行训练、断点续训、测试及导出推理模型等操作。
|
6月前
|
机器学习/深度学习 人工智能 算法
探索AI在医疗影像分析中的应用探索安卓开发中的自定义View组件
【7月更文挑战第31天】随着人工智能技术的飞速发展,其在医疗健康领域的应用日益广泛。本文将聚焦于AI技术在医疗影像分析中的运用,探讨其如何通过深度学习模型提高诊断的准确性和效率。我们将介绍一些关键的深度学习算法,并通过实际代码示例展示这些算法是如何应用于医学影像的处理和分析中。文章旨在为读者提供对AI在医疗领域应用的深刻理解和实用知识。
55 0

热门文章

最新文章