最近大火的两大AI绘图工具 Midjourney VS StableDiffusion

简介: 最近大火的两大AI绘图工具 Midjourney VS StableDiffusion

大家好,今天给大家介绍一下最近大火的两大AI绘图工具,Midjourney (官网)和stable diffusion(官网)。


下面将分别从上手难易程度、出图效果 、出图效率、使用成本进行对比。


1、上手难易度


首先我们来看上手难易度。

Midjourney提供了一个友好的界面来帮助用户了解和操作每一步。它还提供了一个简单的模板,可以让用户快速开始并轻松创建和发布他们的消息。midjourney是基于discord搭建的绘画平台,先注册discord,用discord的账号可以直接登录midjourney,完成后即可进入Midjourney对应的对话框,通过输入不同的命令来调用不同功能。此外,Midjourney还允许用户使用现有的媒体,可以轻松地添加图片等。



进入之后,你可以看到midjourney的公共绘画区,很多人在这里生成图片,实时更新。



左侧栏里可以浏览频道,还有一些newbies-110,newbies-140这些是新手区,可以点进去生成自己的图片。


StableDiffusion,目前是开源的,也就是可以直接在本地部署,它需要用户深入了解技术知识,才能使用它来发布信息。它需要用户熟练掌握编码和数据库技术,才能完全利用它的所有功能。此外,StableDiffusion要求用户自己导入图像,视频等媒体,而不像Midjourney那样提供现成的媒体。当然对于硬件也是有要求的,基本要3g以上显卡显存至少要8gb。同时StableDiffusion模型占据的硬盘也比较多,至少有20-30G空间。当然也可以通过云部署的方式,比如通过Google的clap来部署StableDiffusion,即可通过url进行访问并使用。当然,想要得到更加丰富多彩的图片效果,还需结合不同的模型loray等。


StableDiffusion 大模型的切换,首先是这个界面左上角,在这里可以切换你所安装的模型。



文生图 ,这里与 Midjourney 不同的是,StableDiffusion 有一个反向关键词(意思是不要图片出现什么),文生图的关键词格式与 Midjourney 基本一致。



下面这块参数就是设置图片的一些基本参数,分辨率、尺寸等等,具体参数见下文


图生图,这个也很好理解,放参考图然后输入提示词,与其他 AI 绘画软件一致。



图片信息,意思是你用 SD 画的图,放在这里来,右边会显示这个图片的一些参数,包括关键词。



综合来讲,从上手难易度来说,Midjourney 更容易上手,StableDiffusion 稍难于上手!


2、两大ai绘图工具的出图效果

Midjourney 的底层原理是基于生成对抗网络和深度学习技术,当然我们还是更关注它的出图效果。我们可以看到Midjourney生成的图片都比较精美,目前版本已经升级到v5,真人生成会更加真实,细节处理的也比较到位。但是手指的处理上还是会出现瑕疵,Midjourney生成图片的可控性并不强,需要不断调整prompt,所以这也是目前最大的瓶颈。


例如,想要输入:可爱的女孩,手捧鲜花,背景是情人节活动气球装饰,用在线翻译帮忙翻译成英文关键词,输入:Lovely girl, holding flowers, with Valentine’s Day balloons in the background


机器人会在一分钟之内生成4张图片:



而StableDiffusion 用ldm潜在扩散模型,其目标是消除高斯噪声在训练图像上的连续应用,可以将其视为一系列去噪自动编码器。stable diffusion结合不同的模型,lauray可以生成各种不同风格的图片,通过正向提示词和反向提示词,可以更好的生成想要的图片。stable diffusion不仅仅具备纹身图、图声图、图、声纹这些功能,其嵌入的control net解决了空间一致性问题。以前根本没有有效的方法来告诉ai模型要保留输入图像的哪些部分control net。通过引入一种方法来改变这一点是StableDiffusion,能够使用额外的输入条件来告诉模型确切的做什么,甚至引入三dopen pose,生成人物的姿势或者动作,来精准控制需要生成的图片。这个是目前在a i绘图方面得到较高认可的功能。


例如:油画

prompt: portrait of bob barker playing twister with scarlett johansson, an oil painting by ross tran and thomas kincade




比如,这样的赛博朋克风

prompt: Cyberpunk, 8k resolution, castle, the rose sea, dream



从出图效果看,StableDiffusion在可控性和应用广度上都略胜一筹。


3、出图效率

StableDiffusion 有一个弊端,就是速度非常慢,动辄半个小时起步。

Midjourney是Disco Diffusion的原作者Somnai所加入的AI艺术项目实验室,Midjourney 对 Disco Diffusion 进行了改进,平均1分钟能出图。


4、ai绘图工具的使用成本

(1)、midoriy 如果你第一次在输入框里输入关键词时,弹出的是下面这样的提示。


说明免费用户没资格生成图片,需要去付费,以前的版本是说新用户有25张图片免费生成机会,但其实每输入一次关键词、点击一次放大、微调都算一次,所以25次免费机会很快就用完了,如果还想继续使用,还是需要购买会员。


现在的版本似乎没有新用户免费试用额度了, 已经关闭了免费使用权限,必须订阅才能使用。


目前可以年年和月月付分为三档,basic plan, standard plane plan主要是在出图数量、快速模式时间快速出图模式和并行数有所区别。




(2)、StableDiffusion

StableDiffusion虽然是开源的,可以在本地运行,但是对硬件要求较高。如果不考虑入手硬件的小伙伴,也可以考虑购买类似google collab p的云服务进行部署。我们以google clap为例,有coo lab pro、co lab pro加两种订阅方案。这两个在计算单元上有所区别。同时,collab pro加还支持后台执行,最后还有psugo方案,可以购买更多的计算单元,从使用成本看因人而异。如果只是想生成一些图片,两者都可,成本也相差无几。如果是想长期使用ai绘图工具辅助完成一些工作,我会建议入手一款配置高点的显卡,在本地部署stable defence。从长期投入来看,成本是最低的一种方案。


(3)、成本对比图



相关文章
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
Documind 是一款利用 AI 技术从 PDF 中提取结构化数据的先进文档处理工具,支持灵活的本地或云端部署。
47 8
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
|
12天前
|
人工智能 弹性计算 Serverless
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
本文介绍了零售业中“人—货—场”三要素的变化,指出传统营销方式已难以吸引消费者。现代消费者更注重个性化体验,因此需要提供超出预期的内容。文章还介绍了阿里云基于函数计算的AI大模型,特别是Stable Diffusion WebUI,帮助非专业人士轻松制作高质量的促销海报。通过详细的部署步骤和实践经验,展示了该方案在实际生产环境中的应用价值。
45 6
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
|
12天前
|
机器学习/深度学习 人工智能 搜索推荐
AI与娱乐产业:电影制作的新工具
随着科技的发展,人工智能(AI)逐渐渗透到电影制作中,带来了前所未有的创新。本文探讨了AI在剧本创作、场景构建、特效制作、动作捕捉、音频处理、剪辑及市场调研等领域的应用,以及其对提升效率、激发创意和拓宽视野的影响,展望了AI在未来电影产业中的重要作用。
|
1月前
|
人工智能 搜索推荐 程序员
AI 搜索引擎工具集合
AI 搜索引擎工具集合
AI 搜索引擎工具集合
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
NotebookLM与NotebookLlama 了解下 | AI工具
在AI技术飞速发展的今天,Google和Meta分别推出了基于大型语言模型的笔记本应用——NotebookLM和NotebookLlama。这两款产品不仅提供了强大的文档处理和编码支持,还在文档和编码领域引领了创新。NotebookLM强调个性化和隐私保护,而NotebookLlama则以开源和高度定制性著称。本文将深入解析这两款产品并进行对比分析。【10月更文挑战第16天】
110 2
|
1月前
|
人工智能
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
|
1月前
|
人工智能 自然语言处理 自动驾驶
【通义】AI视界|微软和 OpenAI 将向媒体提供1000万美元资助,推动其使用AI工具
本文概览了近期科技领域的五大热点事件,包括微软与OpenAI联手资助媒体使用AI工具、OpenAI任命前白宫官员为首任首席经济学家、特斯拉FSD系统遭调查、英伟达市值逼近全球第一、以及AMD新一代锐龙9000X3D系列处理器即将上市的消息。更多资讯,请访问通义官网。
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
21款改变世界的AI工具:释放无限创意!
本文收集了21款令人惊叹的人工智能工具,每一款工具都为用户带来了创新与便捷。从数据分析、文档编写、语音克隆到图像升频,这些工具涵盖了多领域的应用。无论是自动化工作流的 n8n,还是开源替代 Notion 的 AppFlowy,这些工具都旨在通过 AI 提高生产力、简化流程,甚至激发更多创意。本文详细介绍了每个工具的用途、功能特点以及使用场景,是你探索 AI 世界的必备指南。
56 0
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
37 1

热门文章

最新文章

下一篇
无影云桌面