详解阿里海报设计AI“鲁班”,没错,人类设计师危险了

简介:
本文来自AI新媒体量子位(QbitAI)

你的双11,买买买。

阿里海报设计师的双11,在一个名为“资源位小组”的小黑屋连续通宵加班。

做海报、改文字、换商品、调设计、换banner,每个设计师对接几个运营人员,富士康流水线一样的重复性工作。一年双11下来,完成上亿张海报。

然而,这一切正在成为过去。

AI改变了围棋,现在也在改变海报设计。

这是一个名为“鲁班”的AI设计师,没错,它将担纲今年双11的banner海报设计,数量高达4亿张。

但考虑到鲁班平均1秒钟就能完成8000张海报设计,一天可以制作4000万张,4亿只能算一个小小小小目标。

鲁班

这个海报设计AI“鲁班”,诞生也与双11有关。

每年双11,都是阿里设计师的大考:海量的设计需求,需要保证所有人都统一规范,遇到紧急设计需求,还要快速出稿,对每一个设计师都是脑力、体力双重考验。

ca75103ac4d8bff90add9bc50d4c187f875e30a2

 千人千面需求的banner设计

于是,2015年双11后,阿里内部开始萌生想法,当年阿里正式在商品推荐上实现“千人千面”,所以希望强营销导向的广告资源位的设计也能实现“千人千面”。

因此“鲁班”项目正式成立,并不断发展至现今的“阿里智能设计实验室”。

当时正值AlphaGo摧枯拉朽,将深度学习和AI传播开来,阿里内部也决定进一步把鲁班打造成一个AlphaGo一样的AI设计师。

进而开始搭建神经网络,让鲁班学习人类设计师的成果和经验,不断进化,到今年双11,鲁班的水平已经达到了阿里内部P6水准。

鲁班的学习进化,主要有三大技术原理。

6a609935da14d105281a4fa48d91f4f78231b7ac

三大核心模块

鲁班从0到P6,自学设计能力主要看三大模块:风格学习(规划+元素)、行动器,以及评估网络。

首先是风格学习模块。

94480544861a8de1ac409c5a00ce91dd20f1e4a5

 鲁班风格学习

鲁班先将大量设计素材的设计数据进行结构化标注,最后经过一系列的神经网络学习,输出空间+视觉的设计框架。

框架设计中,首先通过人工标注的方式,让机器理解该幅设计有哪些元素组成,比如它的商品主体,花的背景,蒙版。

往上一层,还需要通过设计的经验知识,定义一些设计的手法和风格。手法指的是这些元素为什么可以这么构成。

最上面这一层是风格,当这些元素构成之后,它从美学或者视觉角度看是一个什么感受,让机器知道它是用什么组成。

下一步是准备设计的原始文件,比如一系列花朵和设计方法,输入到深度学习网络中。该网络具备一定记忆功能,可以记住设计步骤中复杂的过程。

经过这层神经网络学习之后,会得到一个设计框架。从技术上理解,它是一堆空间特征和视觉特征构成的模型。从设计师的视角来看,它相当于设计师脑里在做一组设计之前那个大概的框架印象。

3079136f9675dcc07b83f64076474c349ce6f81e

在设计框架的同时,元素中心也在批量输入元素(如底图,主产品图、修饰元素等),由元素分类器进行学习,按照视觉特征和类型分类。

具体来说,鲁班团队会提前收集一些版权图库,以及自己造设计元素的方式,输入到元素分类器中。这个分类器会把这些元素分布到各个类型里,比如背景、主体、修饰,也会完成图片库的提取。

其次是行动器。

03f279d19f5ee4f9c950fdaa02822707da6cf2f5

 鲁班行动器元素分类

行动器的主要作用,是根据需求从风格学习模块中选择设计原型,并从元素中心中选取元素,规划出多个最优生成路径,完成图片设计。

这与设计师实际工作过程非常相似,如设计师要设计一朵花,也会在软件里会不断去调每个位置、每个像素、每个角度。同时,整个过程也是一个强化学习的过程,行动器会在不断试错中更聪明、更智能。

此过程完成后,将输出多个设计图,并最终交给“评估网络”对输出产品进行评分。

最后是评估网络。

0e875ad6b74dc9d6781568c079e22a1cbc8548f1

 鲁班评估网络

评估网络的工作原理是输入大量的设计图片和评分数据,经过训练后,让机器学会判断设计的好坏。

鲁班的基础是来源于设计师的设计模板素材和元素素材,因此会有两个设计师角色每天去训练鲁班,一个负责帮助鲁班完成最新的风格学习(风格学习),让鲁班不断进化,不断掌握更好的设计技巧。

另一个的角色则是对鲁班设计出来的成果进行评估(评估网络),告诉鲁班什么样的设计才是最好的。

设计师的核心职责,在于把设计变成数据化。目前,鲁班已经学习了百万级的设计稿,拥有了演变出上亿级的海报设计能力。

实际上,你应该也看出来了,与AlphaGo最初设计一样,鲁班从0到P6,也是设计师+算法工程师的合作成果。

这背后,阿里的设计师和算法工程师做了三大功课。

三大功课

第一,领域研究。找到该领域专家深入研究该领域的经验知识,构建一套机器可以学习的数据模型。视觉设计专家把设计问题抽象成“风格-手法-模板-元素”这样一套数据模型,即把多年视觉设计经验变成机器可学习的“数据”。

第二,数据链路。定义好数据模型后,抓取和标注数据,并对数据集进行分类和管理。在这个过程汇总,如果处理数据给算法训练的更新频次,用什么数据去验证模型,如何评估模型效果,离线模型与在线数据在产品端如何打通?这一系列的数据问题就需要一套清晰的数据链路设计。

第三,算法框架。算法框架由算法科学家来制定,数据和算法的关系就像汽油和发动机,两者密不可分。产品设计师需要与算法讨论,把业务场景和数据问题输入给算法。

这也是阿里内部让产品设计师学习机器学习的原因,因为搞懂算法框架和技术原理,才能更好理解工作原理。

但三方面功课背后,也不是没有具体挑战。

整个鲁班打造过程中,遭遇了三方面技术挑战。

技术挑战

首先是缺少标注数据。今天所有的人工智能都基于大规模结构化标注数据,设计这件事情连数据都没有完成在线化,更别说标准化、结构化的数据。

其次是设计的不确定性。设计是个很不确定的东西,设计需求把握和结果评估都存在人类主观意识。比如你无法给机器输入“高端大气的海报”这样的指令。

最后是无先例可循。整个行业中没有一些现成的技术或者框架可以参考,这和AlphaGo带来的福利不同。

当时AlphaGo团队公布论文后,全世界围棋AI都照此提升了战力,比如腾讯绝艺,很快就做到了世界水平。

但对于鲁班来说,并无先前经验可以参考,一切全凭自己摸索。不过也并非完全没有收获,在探索中的一年,阿里鲁班团队对AI产品有了更为清晰的定义。

他们内部认为,鲁班做的AI是可控的视觉生成。可控,指的是根据商业的需求、业务的需求,智能地进行控制;视觉生成,则表明鲁班解决的是视觉从无到有的问题。

牛刀小试

那么海报设计AI鲁班,效果怎么样?

在2016年双11,鲁班首次登场。它最终制作了1.7亿张广告banner,点击率提升100%。

与人类对比的话,假设每张图,人类设计师需要耗时20分钟,满打满算也需要100个设计师连续做300年。

……

已经不用计算节省的成本了。

而今年,鲁班也被进行了进一步迭代。设计水平显著提升,最新的数据情况是:

鲁班已经学习了百万级的设计稿,拥有演变出上亿级的海报设计能力。

今年双11,鲁班已经可以实现一天制作4000万张海报,平均每秒可实现设计8000张海报,并且每张海报会根据商品图像特征专门设计,换句话说说,鲁班设计出的海报,没有一张会完全一样的。

设计师的未来

毫无疑问,是时候可以谈谈设计师群体的未来了。

按照当前阿里内部对技术岗位的评判体系,海报设计AI鲁班,已经达到了P6水准,后续进阶也只会越来越快。

那设计师会就此被AI替代吗?

会,在阿里体系内,P4左右的设计师都会受到来自机器的“威胁”。

但也不全会,除了“创意”部分让机器无可奈何,人类设计师与机器的竞合中,也会产生“训机师”一样的新职业。

训机师是阿里内部对转型设计师的称呼,这些训机师是鲁班数据中心的核心人员,他们需要为鲁班的进化提供规模更大、更丰富的数据,并且对于很多风格相关的事情实现“结构化数据”的转换。

阿里智能设计实验室告诉量子位,现在的阿里设计师,变成要去学习鲁班系统,学习如何训练机器,同时在美学方面做把控。

“鲁班今年花了半个月时间学会双11设计风格,目前已经开始产出一部分人类没教过它的设计了。但是最具创新意义的创造类设计,目前只能通过“人-机”协同的方式完成。”鲁班负责人乐剩介绍说。

所以,人类设计师朋友,你做好与木匠大师,哦不,是AI设计大师鲁班共处了么?

本文作者:李根 
原文发布时间: 2017-11-06
相关文章
|
6月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
2701 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
6月前
|
人工智能 数据处理 云栖大会
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
848 9
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
|
7月前
|
人工智能
【千问海报大赛·地方风物】创意征集令!用AI解锁家乡新名片,万元奖金等你来战!
用Qwen-Image打破常规!将家乡的地标、方言、美食或热梗,通过错位混搭(赛博山水×古风建筑?霓虹城市×传统小吃?)或风格化创作(复古卡通、漫画方言…)焕发全新视觉冲击力!
321 10
|
8月前
|
人工智能 搜索推荐 API
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
|
7月前
|
机器学习/深度学习 数据采集 人工智能
阿里开源即封神,一上线就斩获4000+ star背后的真相,WebAgent多步骤智能网搜神器,颠覆你对AI的信息检索印象!
WebAgent 是阿里巴巴开源的多步骤智能网搜神器,包含 WebWalker、WebDancer、WebSailor 等模块,支持复杂推理与长上下文信息检索,GitHub 已获 4.7k star,颠覆传统 AI 搜索方式。
1097 1
|
9月前
|
人工智能 IDE 程序员
阿里也出手了!灵码AI IDE问世
各位程序员小伙伴们,是不是还在为写代码头秃?别担心,阿里云带着它的通义灵码 AI IDE 来拯救你啦! 相信不少小伙伴已经在VSCode、JetBrains IDE等主流开发工具中安装过通义灵码这款插件。 通义灵码插件全网总下载量超 1500 万,开发者采纳代码行数超 30 亿且每月增速 20%-30%。 今天我们要说的不是这款插件,而是阿里刚出的“为AI而生的灵码IDE”。
1602 0
|
5月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1397 57
|
5月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
667 30

热门文章

最新文章