AI造福设计师:搭配色板这种苦差事交给GAN就好啦(教程)

简介:
本文来自AI新媒体量子位(QbitAI)


设计师要开工,总是离不开配色方案,也就是色板

不过,做色板可不是个简单的活,色板生成器Colormind的作者Jack Qiao(名字来自Product Hunt,我们下面叫他小乔吧)解释了这项工作难在何处:一系列颜色搭配得好了,大部分人都知道好看,但想解释“为什么”就不那么容易了;要创造出既好看、又符合品牌指导等等预设条件的色板,更是难上加难。

作为一个提起色板就头疼的设计师,小乔配色一靠猜二靠试,三靠从在线颜色生成器和好看的照片上取色。

虽有三大法宝在手,小乔的设计师生涯依然艰难。好在数学功底不错的小乔悟出了一个道理:要做好设计,先过码农关,我高贵的灵感怎能浪费在配色这种事上!

于是,小乔选了算法,开始尝试用机器学习自动生成色板

保守的LSTM

一开始,小乔把生成色板转化成了一个向量序列预测问题:

已知一个由四种颜色组成的序列,下一种颜色是什么?

他选择用长短时记忆网络(LSTM)来解决这个问题,得到的结果是这样的:

有些配色方案看起来还不错,但是LSTM似乎不喜欢明亮的颜色。这个模型害怕失败,总是倾向于选择灰、棕等中性颜色。

小乔试着去优化LSTM,到2016年底终于放弃了。因为,他移情别恋了。

还是GAN好

生成对抗网络(GAN)是Ian Goodfellow于2014年提出的模型,近两年来一直是学术界研究热点。它的主要功能,是用来造假生成以假乱真的图片,量子位曾经写过一个玩转GAN的教程。

小乔觉得,生成色板这个工作交给GAN更合适,确切地说是pix2pix,也就是那篇题为Image-to-Image Translation with Conditional Adversarial Nets的论文,和它的开源代码。

pix2pix有很多衍生品,前些天火遍Twitter的画猫应用也是用它改的。

小乔下载了pix2pix并做了一些改动,用Adobe Color的数据进行训练,让它在残缺的色板里填充颜色。GAN选择的颜色经常和人类不太一样,但还是很好看的。

训练模型时,小乔发现L1参数对视觉效果影响最大,它影响了模型的空间感知。L1数值越高,输出的随机性越低,色彩也更单调。

还有一个很关键的问题:会不会过拟合?既然是用Adobe Color训练,如果它过拟合到了直接返回输入数据的程度,我直接用Adobe Color就好了嘛……按理说一个GAN倒是不会。

小乔测试的结果是,确实和没有过拟合。

从照片提取色板

玩转了根据一两个颜色补全色板,小乔还没折腾狗,他开始研究如何从图片提取色板。

其实,网上已经有不少提取色板的工具,比如说Pictaculous就是这样一个在线工具。这类工具通常使用颜色量化算法MMCQ

提取色板遇到的最大问题来自照片本身:大部分照片,配色其实都不怎么好看。而色板提取常用的MMCQ,往往力求真反映照片的颜色,结果就是生成出的色板也跟着不好看。

不仅不好看,还排列得很随机,跟GAN填充出的色板一点也不一样。

比如说这张照片生成出的色板:

小乔觉得,用GAN应该能让色板变美一点,但他尝试了一种更简单粗暴的方法,并给这种方法起名叫generative-MMCQ

generative-MMCQ,就是先给MMCQ提取的色板生成几个变体,然后将每个色板上的颜色调换一下位置,再用分类器对调换位置后的色板进行打分,然后选出最好的一个。

最后的分类器,掌握着色板的生杀大权。小乔建立了一个独立的分类器并用手选的颜色对它进行训练。

Demo

小乔折腾的结果,就是我们一开始提到的Colormind。

量子位(QbitAI)公众号会话界面回复“色板”,获取本文提到的各种资源链接,包括Colormind、Pictaculous、颜色量化算法、pix2pix等。

可惜没找到Colormind开源算法,希望有大神可以用pix2pix改一个出来~

本文作者:李林
原文发布时间:2017-03-02
相关文章
|
6月前
|
人工智能 物联网 PyTorch
SCEdit:轻量级高效可控的AI图像生成微调框架(附魔搭社区训练实践教程)
SCEdit是一个高效的生成式微调框架,由阿里巴巴通义实验室基础视觉智能团队所提出。
|
1月前
|
自然语言处理 IDE 测试技术
通义灵码史上最全使用教程:秀一秀AI编程新肌肉
通义灵码是阿里云推出的一款智能编码辅助工具,基于通义大模型,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等功能。它支持 Visual Studio Code 和 JetBrains IDEs,适配多 IDE 原生设计,帮助开发者高效、流畅地编码。官方提供了详细的下载和安装指南,以及丰富的功能介绍和使用指南。
272 3
|
3月前
|
人工智能
Suno教程篇:音乐小白也能使用Suno AI零门槛创作音乐?从此只听AI写的歌!
本文是一篇Suno AI音乐创作工具的教程,指导音乐小白如何使用Suno AI零门槛创作音乐,包括准备工作、基础使用、歌曲风格的选择、歌词填入技巧,以及通过实例展示如何为不同场景生成背景音乐。
Suno教程篇:音乐小白也能使用Suno AI零门槛创作音乐?从此只听AI写的歌!
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
这篇文章是一篇保姆级的教程,旨在全面介绍如何与AI进行高效交流,包括ChatGPT的前世今生、应用场景以及提问的基础技巧。
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
|
2月前
|
人工智能 Linux iOS开发
AI超强语音转文本SenseVoice,本地化部署教程!
【9月更文挑战第7天】以下是AI超强语音转文本工具SenseVoice的本地化部署教程:首先确保服务器或计算机满足硬件和软件要求,包括处理器性能、内存及操作系统等。接着从官网下载适合的安装包,并按操作系统进行安装。配置音频输入设备和语言模型后,启动SenseVoice并测试其语音转文本功能。最后根据实际使用情况进行优化调整,并定期更新以获取最新功能。详细步骤需参照官方文档。
579 1
|
2月前
|
机器学习/深度学习 人工智能 测试技术
AI计算机视觉笔记二十五:ResNet50训练部署教程
该项目旨在训练ResNet50模型并将其部署到RK3568开发板上。首先介绍了ResNet50网络,该网络由何恺明等人于2015年提出,解决了传统卷积神经网络中的退化问题。项目使用车辆分类数据集进行训练,并提供了数据集下载链接。环境搭建部分详细描述了虚拟环境的创建和所需库的安装。训练过程中,通过`train.py`脚本进行了15轮训练,并可视化了训练和测试结果。最后,项目提供了将模型转换为ONNX和PT格式的方法,以便在RK3568上部署。
|
3月前
|
数据采集 人工智能 自然语言处理
从零开始学AI:Python完整操作教程
本教程详尽介绍了利用Python进行人工智能操作的核心方法与应用场景,涵盖数据预处理、模型训练与评估全过程。通过源码解析和实战案例(如房价与股票价格预测),读者将学会构建与测试AI模型,并理解其优缺点。教程还探讨了AI在智能客服与医疗诊断等领域的应用,以及如何通过单元测试确保代码质量。通过本教程,初学者能够快速掌握AI基本技能,为未来的技术发展奠定坚实基础。
419 4
从零开始学AI:Python完整操作教程
|
6月前
|
机器学习/深度学习 人工智能 运维
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(二)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
296 1
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(一)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
358 1
|
4月前
|
存储 人工智能 弹性计算
通义万相AI绘画创作评测及图文搭建教程
【7月更文挑战第4天】阿里云的通义万相是AI绘画模型,结合ECS、OSS和API服务,提供无缝创作环境。用户上传图片至OSS,模型通过签名URL下载图片,然后生成AI艺术作品。模型服务具有高性能、易集成的特点,适用于多种场景如设计、广告等。用户可按指示在阿里云官网注册、充值、开通服务并部署。项目评测显示,其集成便捷、响应快、泛化能力强,但仍有改进空间,如增加图像控制选项和批量处理能力。相对于竞品,通义万相在成本、易用性和应用场景上有竞争力,值得推荐。
10577 9

热门文章

最新文章

下一篇
无影云桌面