美图AI绘画机器人上线,小姐姐们,新一轮头像可以换起了

简介:
本文来自AI新媒体量子位(QbitAI)

ba1c3f100a2d01d05c4ceac64c0f421741938c52

你是不是也想要一张插画风格的头像?又要像你,又要插画风格、彩绘色系?

OK,美图AI绘画机器人Andy上线了。

之前美图专门给Angelababy打造的“插画风格”AI绘画师,现在已升级迭代到最新版本美图秀秀App中。

只要上传一张自拍照,“Andy”就能画出不同风格的插画像,风格达10多种。

7b570f36c9783281b6a5d2fb0ebdbe7c60137f6e

其实更早之前,美图还推出过“手绘自拍”的功能,不过相比“Andy”还是弱爆了。

二者区别在于,手绘自拍不能算是完全的人工智能绘画作品,主要是应用了深度学习的技术,分割出头发、皮肤不同区域, 然后在皮肤区域做出不同的特效。

而Andy使用的AI绘画,核心是一套算法在根据用户的照片画画。背后是美图影像实验室(MTlab)最新的影像生成技术:MTgeneration。

443f7b9bdb9a6a449a6c1df5cf5f68225f65220e

背后技术原理

影像生成技术(MTgeneration)核心是基于MTlab自主研发搭建的生成网络Draw Net,通过深度学习技术对大量图像数据进行精准分析与学习,不断增强机器人的绘画能力。

针对不同需求的图像处理的任务,构建出不同应用场景的图像生成模型,经过模型处理,当用户输入自己的图片,Andy便可直接画出相应的插画像。

在这个过程中,还结合使用了美图影像实验室的MTface(人脸技术)和MTsegmentation(图像分割技术)。

目前,AI绘画在全球有几大派别。

107a4cc6d31aa9c1633b39df76eb4f1bcdd93cd8

比如美图投资人李开复在达沃斯论坛上尝试过的机械臂为人作画或者用机械臂copy的作品;

又比如谷歌的AutoDraw,可以根据用户画的简笔画,匹配数据库的图片,生成一幅完整的画。

而美图Andy是基于插画数据进行分析和学习,建模,因此可以根据用户上传的自拍照,来画出用户专属的不同风格插画像,不是简单的复制粘贴或是风格迁移,是AI艺术化的产物。

在美图Andy之前,也还没有AI绘画产品直接用于移动端。

除了移动产品化打磨,美图Andy还有一些技术上的挑战:

相比于风景和静物绘画,人像是一个具有明显主流观念和复杂规则的特殊对象,细微的瑕疵和丝毫的违和都会打破人像艺术作品的完整性、协调性。

所以,用户对于人像画的容错率更低,利用AI绘制人像画的要求更高,难度也更大。

美图MTlab的解决方式是通过分析不同风格的插画作品,归纳出大到构图、小到笔触的不同层面的艺术风格和绘制规则;再通过不断尝试对各式各样的年龄、性别、人种的人物进行人像绘制来印证它掌握的“艺术理解”。

与此同时,MTlab还不断训练AI插画技术的归纳纠错能力,它会在反复的失败中——大约画了数十万张画作,相当于一个画师一辈子作品的上百倍,不断修正完善,使其最终理解并可以在超出“老师”所教授的情境下进行创作。

f25e59ed99bd16983b496424f873e0accb18bbd4

MTlab

值得注意的是,Andy也算是美团影响实验室MTlab出品的第一款移动端AI产品,之前,这个美图内部专注于机器视觉和机器学习的研发团队,由CTO Mitta担纲,神龙见首不见尾。

量子位获悉,MTlab作为美图AI算法研发主力,目前主要的涉足领域有:人脸技术、图像识别、图像/视频美化、3D视觉、人像美化,以及AR技术——之前还参与了AR项目亮风台的投资。

美图去年香港IPO时,MTlab也是公司路演展示的“潜力股”,由于美图在图像数据和用户方面的规模,在深度学习为核心的AI突破方面,并不缺乏基础。

目前MTlab主要有这么几方面技术应用:

MTface,人像处理基础,自主研发了包括人脸检测、人脸关键点、人脸属性分析(性别、年龄)等,能够在复杂条件下实时进行准确分析,人脸检测已经在权威数据集FDDB上试过水,排名还不错。

MT3Dtech,人脸3D模型重建,通过人脸正面照片就能完成,可以实现更加逼真的人像编辑。

MTrestoration,对低画质图像进行增强、去噪、去模糊和超分辨率处理等。

MTsegmentation,图像分区处理,通过分析轮廓、遮挡、颜色、文理、形状等把图像划分成若干互不交迭区域,美图在头发分割和皮肤分割方面准确率达到98.5%——相比传统平均准确率80%,可以说很高了。

MTstyle,利用卷积神经网络实现的风格迁移,即对普通图像进行艺术化处理,俗称“加滤镜”。

MTbeauty,这是美图最核心的美颜算法,通过人脸分析,进行不同年龄、性别的个性化美颜处理,同时通过大规模数据训练和机器学习,优化美颜效果。

MTphotos,通过人脸识别和图像识别进行的照片归类管理——目前在手机中已经很常见了。

MTmakeup,主打“化妆”,背后是人脸检测技术,使用人脸网格分析,实时图像和视频中的实时上妆,被用到了直播产品美拍和电商产品中。

毫无疑问,MTlab也是美图未来重点打造的技术实验室。美图IPO上市时,美图CEO吴欣鸿反复强调:AI趋势如此汹涌,唯有更大的品牌效应、更大的资本推动,才能在AI时代竞争中保持前进。

现在,他推出AI绘画机器人:Andy。

本文作者:李根 假装
原文发布时间: 2017-12-01
相关文章
|
23天前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
181 64
|
27天前
|
人工智能 机器人 Shell
AI语音机器人安装方法 AI机器人安装代码
AI语音机器人安装方法 AI机器人安装代码
29 2
|
1月前
|
人工智能 自然语言处理 机器人
手把手带你搭建一个语音对话机器人,5分钟定制个人AI小助手(新手入门篇)
本文介绍了如何从零开始搭建一个语音对话机器人,涵盖自动语音识别(ASR)、自然语言处理(NLP)和文本到语音合成(TTS)三大核心模块。通过使用开源工具如FunASR、LLaMA3-8B和ChatTTS,以及FastAPI和Gradio等技术,详细指导读者轻松实现个人AI小助手的构建,适合技术新手快速上手。
215 1
|
2月前
|
机器学习/深度学习 人工智能 自动驾驶
2024.10|AI/大模型在机器人/自动驾驶/智能驾舱领域的最新应用和深度洞察
本文介绍了AI和大模型在机器人、自动驾驶和智能座舱领域的最新应用和技术进展。涵盖多模态大语言模型在机器人控制中的应用、移动机器人(AMRs)的规模化部署、协作机器人的智能与安全性提升、AR/VR技术在机器人培训中的应用、数字孪生技术的优化作用、Rust语言在机器人编程中的崛起,以及大模型在自动驾驶中的核心地位、端到端自动驾驶解决方案、全球自动驾驶的前沿进展、智能座舱的核心技术演变和未来发展趋势。
160 2
|
2月前
|
人工智能 自动驾驶 搜索推荐
【通义】AI视界|苹果AI本周正式上线,将引入四大功能
本文由【通义】自动生成,涵盖苹果AI上线、特斯拉被华尔街重新评估、谷歌开发控制计算机的AI、Meta与路透社合作及Waymo获56亿美元融资等科技动态。点击链接或扫描二维码获取更多信息。
|
1月前
|
机器学习/深度学习 人工智能 运维
电话机器人源码-智能ai系统-freeswitch-smartivr呼叫中心-crm
电话机器人源码-智能ai系统-freeswitch-smartivr呼叫中心-crm
50 0
|
1月前
|
存储 人工智能 搜索推荐
AI智能语音机器人的基本业务流程
简介: 先画个图,了解下AI语音机器人的基本业务流程。上图是一个AI语音机器人的业务流程,简单来说就是首先要配置话术,就是告诉机器人在遇到问题该怎么回答,这个不同公司不同行业的差别比较大,所以一般每个客户都会配置其个性化的话术。话术配置完成后,需要给账号配置线路,目的就是能够顺利的把电话打出去。线路配完后,就是建立任务了,说白了就是导入电话号码,因为资源有限,不可能导入一批立即打完,所以需要以任务的形式分配给机器人,然后机器人逐个完成。值得一提的是,如果有多条线路,创建任务时建议提供线路选择功能,很多公司的业务不止一个城市,而大家又是比较习惯接听自己所在城市的电话,所以这个选择主
|
2月前
|
机器学习/深度学习 传感器 人工智能
马斯克的AI机器人可以拯救一个陷入困境的教育系统吗?
马斯克的AI机器人可以拯救一个陷入困境的教育系统吗?
|
2月前
|
人工智能 算法 前端开发
首个 AI 编程认证课程上线!阿里云 AI Clouder 认证:基于通义灵码实现高效 AI 编码
为了帮助企业和开发者更好使用通义灵码,阿里云上线了“AI Clouder 认证课程--基于通义灵码实现高效 AI 编码”。本课程汇聚了后端、前端、算法领域 5 名实战派专家,带你体验 4 大研发场景实践,上手 3 大实操演练,深度掌握智能编码助手通义灵码,实现全栈 AI 编码技能跃升。
|
2月前
|
人工智能 算法 前端开发
首个 AI 编程认证课程上线!阿里云 AI Clouder 认证:基于通义灵码实现高效 AI 编码
为了帮助企业和开发者更好使用通义灵码,阿里云上线了“AI Clouder 认证课程--基于通义灵码实现高效 AI 编码”。本课程汇聚了后端、前端、算法领域 5 名实战派专家,带你体验 4 大研发场景实践,上手 3 大实操演练,深度掌握智能编码助手通义灵码,实现全栈 AI 编码技能跃升。
下一篇
DataWorks