美图AI绘画机器人上线,小姐姐们,新一轮头像可以换起了

简介:
本文来自AI新媒体量子位(QbitAI)

ba1c3f100a2d01d05c4ceac64c0f421741938c52

你是不是也想要一张插画风格的头像?又要像你,又要插画风格、彩绘色系?

OK,美图AI绘画机器人Andy上线了。

之前美图专门给Angelababy打造的“插画风格”AI绘画师,现在已升级迭代到最新版本美图秀秀App中。

只要上传一张自拍照,“Andy”就能画出不同风格的插画像,风格达10多种。

7b570f36c9783281b6a5d2fb0ebdbe7c60137f6e

其实更早之前,美图还推出过“手绘自拍”的功能,不过相比“Andy”还是弱爆了。

二者区别在于,手绘自拍不能算是完全的人工智能绘画作品,主要是应用了深度学习的技术,分割出头发、皮肤不同区域, 然后在皮肤区域做出不同的特效。

而Andy使用的AI绘画,核心是一套算法在根据用户的照片画画。背后是美图影像实验室(MTlab)最新的影像生成技术:MTgeneration。

443f7b9bdb9a6a449a6c1df5cf5f68225f65220e

背后技术原理

影像生成技术(MTgeneration)核心是基于MTlab自主研发搭建的生成网络Draw Net,通过深度学习技术对大量图像数据进行精准分析与学习,不断增强机器人的绘画能力。

针对不同需求的图像处理的任务,构建出不同应用场景的图像生成模型,经过模型处理,当用户输入自己的图片,Andy便可直接画出相应的插画像。

在这个过程中,还结合使用了美图影像实验室的MTface(人脸技术)和MTsegmentation(图像分割技术)。

目前,AI绘画在全球有几大派别。

107a4cc6d31aa9c1633b39df76eb4f1bcdd93cd8

比如美图投资人李开复在达沃斯论坛上尝试过的机械臂为人作画或者用机械臂copy的作品;

又比如谷歌的AutoDraw,可以根据用户画的简笔画,匹配数据库的图片,生成一幅完整的画。

而美图Andy是基于插画数据进行分析和学习,建模,因此可以根据用户上传的自拍照,来画出用户专属的不同风格插画像,不是简单的复制粘贴或是风格迁移,是AI艺术化的产物。

在美图Andy之前,也还没有AI绘画产品直接用于移动端。

除了移动产品化打磨,美图Andy还有一些技术上的挑战:

相比于风景和静物绘画,人像是一个具有明显主流观念和复杂规则的特殊对象,细微的瑕疵和丝毫的违和都会打破人像艺术作品的完整性、协调性。

所以,用户对于人像画的容错率更低,利用AI绘制人像画的要求更高,难度也更大。

美图MTlab的解决方式是通过分析不同风格的插画作品,归纳出大到构图、小到笔触的不同层面的艺术风格和绘制规则;再通过不断尝试对各式各样的年龄、性别、人种的人物进行人像绘制来印证它掌握的“艺术理解”。

与此同时,MTlab还不断训练AI插画技术的归纳纠错能力,它会在反复的失败中——大约画了数十万张画作,相当于一个画师一辈子作品的上百倍,不断修正完善,使其最终理解并可以在超出“老师”所教授的情境下进行创作。

f25e59ed99bd16983b496424f873e0accb18bbd4

MTlab

值得注意的是,Andy也算是美团影响实验室MTlab出品的第一款移动端AI产品,之前,这个美图内部专注于机器视觉和机器学习的研发团队,由CTO Mitta担纲,神龙见首不见尾。

量子位获悉,MTlab作为美图AI算法研发主力,目前主要的涉足领域有:人脸技术、图像识别、图像/视频美化、3D视觉、人像美化,以及AR技术——之前还参与了AR项目亮风台的投资。

美图去年香港IPO时,MTlab也是公司路演展示的“潜力股”,由于美图在图像数据和用户方面的规模,在深度学习为核心的AI突破方面,并不缺乏基础。

目前MTlab主要有这么几方面技术应用:

MTface,人像处理基础,自主研发了包括人脸检测、人脸关键点、人脸属性分析(性别、年龄)等,能够在复杂条件下实时进行准确分析,人脸检测已经在权威数据集FDDB上试过水,排名还不错。

MT3Dtech,人脸3D模型重建,通过人脸正面照片就能完成,可以实现更加逼真的人像编辑。

MTrestoration,对低画质图像进行增强、去噪、去模糊和超分辨率处理等。

MTsegmentation,图像分区处理,通过分析轮廓、遮挡、颜色、文理、形状等把图像划分成若干互不交迭区域,美图在头发分割和皮肤分割方面准确率达到98.5%——相比传统平均准确率80%,可以说很高了。

MTstyle,利用卷积神经网络实现的风格迁移,即对普通图像进行艺术化处理,俗称“加滤镜”。

MTbeauty,这是美图最核心的美颜算法,通过人脸分析,进行不同年龄、性别的个性化美颜处理,同时通过大规模数据训练和机器学习,优化美颜效果。

MTphotos,通过人脸识别和图像识别进行的照片归类管理——目前在手机中已经很常见了。

MTmakeup,主打“化妆”,背后是人脸检测技术,使用人脸网格分析,实时图像和视频中的实时上妆,被用到了直播产品美拍和电商产品中。

毫无疑问,MTlab也是美图未来重点打造的技术实验室。美图IPO上市时,美图CEO吴欣鸿反复强调:AI趋势如此汹涌,唯有更大的品牌效应、更大的资本推动,才能在AI时代竞争中保持前进。

现在,他推出AI绘画机器人:Andy。

本文作者:李根 假装
原文发布时间: 2017-12-01
相关文章
|
8月前
|
人工智能 测试技术 项目管理
测试不再碎片化:AI智能体平台「项目资料套件」功能上线!
在实际项目中,需求文档分散、整理费时、测试遗漏等问题常困扰测试工作。霍格沃兹推出AI智能体测试平台全新功能——项目资料套件,可将多个关联文档打包管理,并一键生成测试用例,提升测试完整性与效率。支持套件创建、文档关联、编辑删除及用例生成,适用于复杂项目、版本迭代等场景,助力实现智能化测试协作,让测试更高效、更专业。
|
8月前
|
存储 人工智能 测试技术
用AI提升测试效率:智能体平台的「需求文档管理」功能上线啦!
霍格沃兹测试开发学社推出AI智能体测试平台,全新「需求文档管理」功能助力高效测试准备。集中管理需求文档,支持多种上传方式,智能生成测试用例,提升测试效率与准确性,助力迈向智能化测试新时代。
|
人工智能 自然语言处理 前端开发
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
淘宝推荐信息流业务,常年被“需求多、技术栈杂、协作慢”困扰,需求上线周期动辄一周。WaterFlow——一套 AI 驱动的端到端开发新实践,让部分需求两天内上线,甚至产品经理也能“自产自销”需求。短短数月,已落地 30+ 需求、自动生成 5.4 万行代码,大幅提升研发效率。接下来,我们将揭秘它是如何落地并改变协作模式的。
1051 37
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
|
10月前
|
人工智能 安全 大数据
硬核来袭!「AI 进化论:智算时代 OS 的破局之路」首期直播上线
从学术前沿到企业实践,从技术演进到生态共建,深度拆解 AI 时代操作系统的挑战与机遇,揭秘阿里云服务器操作系统背后的技术沉淀与产品布局。
|
10月前
|
人工智能 自然语言处理 数据可视化
AI 助手带你玩转数据分析!通义灵码保姆级教学 | 共学课2期上线
7月15日20:00,通义灵码联合WaytoAGI社区推出《AI助手带你玩转数据分析》公开课。零门槛、零代码,只需中文指令,即可完成数据读取、分析到报告生成全流程。告别代码恐惧,业务人员也能轻松掌握数据分析,提升职场竞争力。
361 0
|
7月前
|
人工智能 编解码 芯片
【AI绘画】你有多久没有打开SD了?
曾几何时,Stable Diffusion的复杂参数令人崩溃,如今即梦、可灵等AI工具已让生成图片变得轻而易举。哩布哩布发布2.0升级公告,看似迈向更易用的未来,却也悄然为那个钻研模型、拼接工作流的“拓荒时代”奏响终章。技术迭代飞快,但那份对创造的热爱与探索精神,永不褪色。
957 9
|
8月前
|
人工智能 Java 机器人
基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API
Spring AI Alibaba集成Ollama,基于Java构建本地大模型应用,支持流式对话、knife4j接口可视化,实现高隐私、免API密钥的离线AI服务。
6568 2
基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API
|
8月前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
|
8月前
|
机器学习/深度学习 人工智能 机器人
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
|
8月前
|
存储 人工智能 监控
LangGraph实战:从零构建智能交易机器人,让多个AI智能体像投资团队一样协作
如今的量化交易已远超传统技术指标,迈向多智能体协作的新时代。本文介绍了一个基于 **LangGraph** 构建的多智能体交易系统,模拟真实投资机构的运作流程:数据分析师收集市场情报,研究员展开多空辩论,交易员制定策略,风险团队多角度评估,最终由投资组合经理做出决策。系统具备记忆学习能力,通过每次交易积累经验,持续优化决策质量。
1367 8
LangGraph实战:从零构建智能交易机器人,让多个AI智能体像投资团队一样协作