中国风?古典系?AI中文绘图创作尝鲜!⛵

简介: 本文对百度开源的中文 AI 图像生成器 ERNIE 进行讲解,包括工具简介、通过Demo页面和API两种使用方式,以及使用中文提示词生成的图像效果。
e0fad7bb0ab1629b48f3bbebdfde3092.png
💡 作者: 韩信子@ ShowMeAI
📘 深度学习实战系列https://www.showmeai.tech/tutorials/42
📘 本文地址https://www.showmeai.tech/article-detail/413
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏 ShowMeAI查看更多精彩内容

💡 引言

4383dc7096c21cc233642add2785628a.png

人工智能图像生成器现在风靡一时。虽然 📘Dall-E2、 📘MidJourney和 📘Stable Diffusion目前处于中心舞台,但是百度开发的开源 AI 图像生成器 📘ERNIE-ViLG 也在互联网上流传。

💡 ERNIE-ViLG 是什么

ERNIE 代表通过知识整合增强表示——视觉语言生成。它是一个统一的生成预训练框架,用于使用 Transformer 模型进行双向图像文本生成。

需要明确的是,ERNIE 并不是 Stable Duffusion 的一个变体版本,尽管这两种模型都是开源的。根据 📘ERNIE论文,ERNIE-ViLG 2.0 是一种改进的文本到图像扩散模型,具有知识增强的去噪专家组合,以结合有关视觉场景的额外知识,并在不同步骤中解耦去噪能力。

76218264730659fa2a199727cf56d425.png

💡 ERNIE-ViLG 使用方法

现在可以通过 huggingface 免费访问该模型。我们可以在 📘ERNIE-ViLG Demo 查看工具实例。

1bb0ce07780d8fa8ad02545f55b19a2d.png

界面非常简单:可以看到经典的提示框,各种艺术风格的选择,以及图像分辨率。在艺术风格方面,ERNIE 提供了一些有趣的选择。这让我想起了 📘Dream by WOMBO 中的一个类似功能。

d9d9e92667ab7eeabfab230f707dda6f.png

让我们用提示“An astronaut riding a horse in space”来生成样本。

d56bbbdc1e01fe7841e9edc0b824d6f4.png

该应用程序生成六张分辨率为 1024x1024 的图像。

ERNIE 的研究人员声称,他们的方法比 Dall-E2 和 Stable Diffusion 产生更清晰、更自然的细节。

真的吗?现在让我们尝试将艺术风格更改为“油画”。

3dbda45b032f82482eb7402e656e654e.png

这些结果本身都非常惊艳。

质量上,ERNIE 可以与 Dall-E2 和 Stable Diffusion 相媲美。但是,它在一致性方面表现不佳,就像在上面提到的,其中两个结果中的马无处可寻。这可能是训练ERNIE的数据集较小所致。

不过,如果仔细考虑数据集的大小,训练了 14.5 亿张图像的 ERNIE 与 MidJourney、Google Parti 等大型竞争对手的差距并不大。

5d634d3f4b6b4eeaa20f3c4e78c9b753.png

也许开发人员找到了一种优化算法的方法,使其能够在较小的数据集上运行良好。我假设如果模型是在更大的数据集上训练的,现有的限制就会消失。

需要特别注意的是,ERNIE 是用中文开发的。这意味着,在开始图像生成过程之前,必须将英文提示翻译成中文。当然,使用中文的宝宝可以尽情玩耍~

这里有更多示例结果。

fdf89dc084d7e0edebf84d24c2a86163.png
上图提示文字:“戴眼镜的猫”风格“油画”
5f45418d2bb58d8dfd5809b01a1767f3.png
上图提示文字:“五官端正的绘画女生”

💡 API 访问 ERNIE-ViLG

您可以通过 API 访问 ERNIE。如果您想尝试使用 API,请按照这个 📘GitHub 上的指南进行操作。

示例 API 调用如下所示。

def generate_image(
          text_prompts:str,
          style: Optional[str] = "探索无限",
          topk: Optional[int] = 6,
          output_dir: Optional[str] = 'ernievilg_output')
  • text_prompts:输入提示
  • style :生成图像的风格
  • topk:生成图像的数量(最多 6 个)
  • output_dir:保存输出图像的目录

ERNIE 的使用指南还有一个建议列表,可帮助您找到结合使用样式和修饰符的最佳方式。

  • 【作图规则】Prompt构建是文本符合逻辑的组合,有序且丰富的描述可以不断提升画面效果
  • 【新手入门】不知如何输入Prompt?点击示例,体验文生图的魅力,参考教程,逐步进阶~
  • 【风格生成】试试添加 “国潮”、“国风”等,感受中国风的魅力
  • 【风格生成】试试混合两种代表性的风格,例如“赛博朋克,扁平化设计”、”皮克斯动画,赛博朋克”
  • 【人像生成】添加“仙鹤、月亮、楼阁、小屋、街道、玫瑰、机械”,画面会更饱满
  • 【人像生成】添加“精致面容、唯美、cg感、细节清晰“等,人物刻画会更细致
  • 【风格生成】添加“扁平化风格,logo”等,可以设计出各类图标等,例如 “猫猫头像,扁平化风格”
  • 【风格生成】指定颜色,或添加“烟雾缭绕”、“火焰”、“烟尘”、“花瓣”,生成画面的氛围感更饱满
  • 【创意生成】发挥想象力,例如:“中西混搭”、“泰迪熊唱京剧”、“米老鼠吃火锅”
  • 【风格生成】“水彩”,“水墨”与古诗组合,画面意境会有提升~
  • 【风格生成】想要日系头像和拟人化动物?试试关键词“日系手绘”、“治愈风”
  • 【风格生成】添加“pixiv”,生成二次元或者动漫的画质更惊艳

参考资料

推荐阅读

🌍 数据分析实战系列https://www.showmeai.tech/tutorials/40
🌍 机器学习数据分析实战系列https://www.showmeai.tech/tutorials/41
🌍 深度学习数据分析实战系列https://www.showmeai.tech/tutorials/42
🌍 TensorFlow数据分析实战系列https://www.showmeai.tech/tutorials/43
🌍 PyTorch数据分析实战系列https://www.showmeai.tech/tutorials/44
🌍 NLP实战数据分析实战系列https://www.showmeai.tech/tutorials/45
🌍 CV实战数据分析实战系列https://www.showmeai.tech/tutorials/46
🌍 AI 面试题库系列https://www.showmeai.tech/tutorials/48

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
相关文章
|
6月前
|
人工智能 自然语言处理 开发者
AIGC创作活动 | 跟着UP主秋葉一起部署AI视频生成应用!
本次AI创作活动由 B 站知名 AI Up 主“秋葉aaaki”带您学习在阿里云 模型在线服务(PAI-EAS)中零代码、一键部署基于ComfyUI和Stable Video Diffusion模型的AI视频生成Web应用,快速实现文本生成视频的AI生成解决方案,帮助您完成社交平台短视频内容生成、动画制作等任务。制作上传专属GIF视频,即有机会赢取乐歌M2S台式升降桌、天猫精灵、定制保温杯等好礼!
|
6月前
|
人工智能 自然语言处理 文字识别
阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
【2月更文挑战第17天】阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
410 2
阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
|
7天前
|
人工智能 弹性计算 Serverless
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
本文介绍了零售业中“人—货—场”三要素的变化,指出传统营销方式已难以吸引消费者。现代消费者更注重个性化体验,因此需要提供超出预期的内容。文章还介绍了阿里云基于函数计算的AI大模型,特别是Stable Diffusion WebUI,帮助非专业人士轻松制作高质量的促销海报。通过详细的部署步骤和实践经验,展示了该方案在实际生产环境中的应用价值。
38 6
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
|
1月前
|
人工智能 自然语言处理 数据挖掘
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
|
4月前
|
机器学习/深度学习 人工智能 算法
解决方案评测:通义万相 AI 绘画创作
通义万相 AI 绘画创作工具在功能、使用体验等方面表现出色,为用户提供了一种便捷、高效的绘画创作方式。虽然存在一些不足之处,但随着技术的不断发展和优化,相信其性能和表现会不断提升。对于艺术家、设计师、创意工作者以及普通爱好者来说,通义万相都是一款值得尝试和探索的 AI 绘画工具。
400 4
解决方案评测:通义万相 AI 绘画创作
|
3月前
|
人工智能 Serverless API
AI 创业及变现新思路:零门槛 AI 绘图,定制 ComfyUI Serverless API 应用
为了帮助用户高效率、低成本应对企业级复杂场景,本文介绍 ComfyUI API Serverless 版解决方案,通过使用该方案,用户可以充分利用 ComfyUI +Serverless 技术优势快速开发上线 AI 绘画应用,期待为广大开发者 AI 绘画创业及变现提供思路。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AICG驱动的叙事革命:AI在电影剧本创作中的角色
【7月更文第25天】随着人工智能技术的发展,尤其是自然语言处理(NLP)的进步,AI已经开始涉足创意写作领域。在电影行业中,AI不仅能够帮助创作概念和大纲,甚至还能生成完整的剧本草稿。本文将探讨AI如何改变电影剧本创作,并通过一个简单的Python示例展示如何利用AI模型生成剧本片段。
105 3
|
4月前
|
人工智能 弹性计算 自然语言处理
通义万相AI创作绘画产品方案产品体验
本次我有幸接触并体验了阿里云通义万相这一创新的AI绘画工具方案。该方案它是在利用人工智能技术,为用户提供创新、便捷的绘画创作体验。在体验过程中,我主要关注了产品的易用性、功能性、创新性、用户体验及方案本身等方面。
168 3
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|
5月前
|
机器学习/深度学习 人工智能 算法
OpenAI发布全新AI视频模型Sora:引领视频创作新纪元
OpenAI发布全新AI视频模型Sora:引领视频创作新纪元