小小前端如何在AIGC领域“乘风破浪”

简介: 作者从7月份开始做AIGC相关的项目有了一些感触和经验总结分享给大家,生成图片的质量提升一方面来自于AIGC领域大模型和开源插件的飞速发展,一方面来自对于生成路线和参数的理解加深。

image.png

不是在阳光☀️、沙滩🏖️上欣赏美图,而是在波涛汹涌的大海上狂风暴雨中瑟瑟发抖。


前言

从7月份开始做AIGC相关的项目,至今已经4个月了。在整理生成文档时,可以明显的看到生成的图像质量有了很大的提升,突然有了很多感触,生成质量的提升一方面来自于AIGC领域大模型和开源插件的飞速发展,一方面来自对于生成路线和参数的理解加深。因此,想对于这几个月的项目内容和生成经验做一些总结。

image.png

Cyber项目简介

Cyber是技术平台发起的一个专注于AIGC工程化的内部项目,包括生成流程Maas能力输出、模型训练、部署、测试等一系列解决方案。目前在AI模特方向和智能背景生成上技术相对比较成熟。

image.png

AI模特

image.png

应用场景:

AI模特的生成可以to B也可以to C。to B可以帮助商家减少商拍成本,提高拍摄效率,只要商家提供若干张平铺的服装、或者穿在假人上的服装、或者是真人穿着的服装,就可以按需生成不同人种模特、不同背景的商品图。to C也有很多玩法,像妙鸭相机、AI试衣间等。

技术方案类型:
类型 SD Lora SD impainting Midjourney垫图 VITON/tryon GAN tryon Diffusion
适用范围及简介 平铺类服装需要输入多件训练,输出不能保证完全相同用户等待时间长 人台/真人穿着服装能够保证服装细节/图案完全一致


颜色+款式简单的服装mj生成模特效果比较自然,badcase少。但是无法保证服装细节完全一致。 上一代炼丹炉开源可以实现多角度、多形体 新一代,基于扩散模型,基于2个UNet的diffusion模型暂未开源,谷歌出品论文数据表明效果好于VITON/tryon GAN等

效果概览:

image.png

智能背景

image.png

应用场景:

智能背景一般针对静物,对于电子类、家居类、饰品、化妆品等进行背景美化。通过对商品进行品类匹配,推荐对应的AI背景。这个能力可以说是商家接受度比较高,使用频次比较高的场景,一般都是自动/手动抠图+画布定位+sd impainting+图像编辑。

效果概览:

image.png

现阶段体验

行业现状

image.png

(the Industry Chain of AIGC,from AI-Generated Content (AIGC): A Survey)

AI行业上游包括数据标注、数据供应、开源算法、电脑硬件等行业;中游则是云计算、效能提升、实时交互领域,例如谷歌、openAI等大型科技公司 ;下游则是内容生成平台、内容分发平台、内容检测平台等行业。

大众还在兴奋狂欢抑或是抗拒时,行业巨头们已经完成了相关布局。不管用户接受度进展如何,芯片、云服务行业也已经实打实赚到了AIGC第一桶金。


用户接受度

AIGC火了之后,不一定每个人都用过aigc,但是大部分人可能都看过AI的生成结果。有人凭借AIGC创建个人IP成为博主,有人凭借一眼鉴AI diss AIGC成为博主。那么,对于电商领域用户是否能够接受AI生成的图呢?是否可以对于用户的购买决策起正向引导的作用呢?这个问题可能还需要时间和数据来回答,根据现有的数据,美化后的图片的确从一定程度上提高了点击量。也期待更多国内外电商行业内的AIGC数据共享。

社交媒体正面关注

image.png

在社交媒体上上传AIGC生成的图片内容、AIGC生成教学等,都有不少博主取得了不错的关注度。现在也有很多AI主播,AI IP等,又美又不会翻车,还能24小时上班,谁能不爱!

社交媒体负面评价

image.png

也会看到一些负面评价,主要担忧AIGC图片引起的版权问题,或者电商领域货不对板的问题。

灵魂发问前端在AIGC领域能干嘛?

为生成效果负责

因AIGC而出现的工作,一般前端可以负责前期的技术调研,设计师进行风格扩展(1)探索AI图像生成流程,针对不同类型业务场景输出稳定的生成工作流

image.png

(2)探索多领域AI生成,如宠物、二次元、视频等生成方式

image.png

开放组件(生成交互/图像处理/图层合并/画布拖动/手动抠图等)、工程化产品

AI领域特有组件,如抠图、3d openpose编辑器、图像处理编辑器、画布拖动合图等AIGC相关组件将会整理并发布在《Cyber前端组件接入文档》中,多探索AIGC领域更丝滑的用户交互


几个想法

版权问题引起的创意枯竭

作为野蛮生长的新兴领域,大家的使用场景和生成作品天马行空。但是毫无疑问,AI生成的大模型训练数据依赖现有的数据沉淀。如果大家都走AIGC生成的捷径,谁还会耐心的耗费大量的时间和心血进行创新,创造新的属于人类的知识财富。当然这个问题早已引起了很多关注,很多版权相关的限制已经出来,这个行业也会越来越规范。

审美疲劳

完美导致的不完美,和项目组的设计同学沟通也是有类似感受。看多了AIGC的图,会有一定程度的审美疲劳,分不出美丑。这也让我想到,真实世界正是因为其多元化才会充满吸引力和创造力。

工作机会变少还是变多

AIGC的出现,让很多行业感受到了威胁,岗位减少、门槛变高。也会有设计师将AI作为一个很好的创意提效工具,创作出让人耳目一新的作品。在C站看到很多利用photoshop+sd+midjourney+dall-e组合生成+后期的图/视频,非常惊艳。在AIGC的世界,大家不再是求图,而是求生产图片的工作流。

image.png


作者 | 苓均

来源 | 阿里云开发者公众号



相关文章
|
5月前
|
SQL 人工智能 前端开发
前端问题之前端在AIGC领域可以承担哪些工作
前端在AIGC领域可以承担哪些工作
101 0
|
7月前
|
前端开发 Java 网络架构
[AIGC] Spring 获取前端请求参数的全面指南
[AIGC] Spring 获取前端请求参数的全面指南
|
7月前
|
人工智能 自然语言处理 前端开发
前端训练不规范导致AIGC模型“上梁不正”
【1月更文挑战第23天】前端训练不规范导致AIGC模型“上梁不正”
92 1
前端训练不规范导致AIGC模型“上梁不正”
|
5月前
|
存储 自然语言处理 API
通义万相AIGC技术Web服务体验评测
随着人工智能技术的不断进步,图像生成技术已成为创意产业的一大助力。通义万相AIGC技术,作为阿里云推出的一项先进技术,旨在通过文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,加速艺术家和设计师的创作流程。本文将详细评测这一技术的实际应用体验。
200 4
|
1月前
|
人工智能 自然语言处理 数据可视化
什么是AIGC?如何使用AIGC技术辅助办公?
2分钟了解AIGC技术及其如何提高日常办公效率!
77 4
什么是AIGC?如何使用AIGC技术辅助办公?
|
2月前
|
人工智能 自然语言处理 数据挖掘
Claude 3.5:一场AI技术的惊艳飞跃 | AIGC
在这个科技日新月异的时代,人工智能(AI)的进步令人惊叹。博主体验了Claude 3.5 Sonnet的最新功能,对其卓越的性能、强大的内容创作与理解能力、创新的Artifacts功能、视觉理解与文本转录能力、革命性的“computeruse”功能、广泛的应用场景与兼容性以及成本效益和易用性深感震撼。这篇介绍将带你一窥其技术前沿的魅力。【10月更文挑战第12天】
86 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索AIGC的底层技术:人工智能通用计算架构
探索AIGC的底层技术:人工智能通用计算架构
190 3
|
2月前
|
人工智能 自然语言处理 搜索推荐
超越边界:探索2023年AIGC技术盛宴,预测前沿科技的奇迹 🚀
本文探讨了互联网内容生产从PGC、UGC到AIGC的演变,特别关注了AIGC(人工智能生成内容)的发展及其对未来内容生产的深远影响。文章详细介绍了AIGC的定义、技术进展(如生成算法、多模态技术、AI芯片等),并展示了AIGC在多个领域的广泛应用,如代码生成、智能编程、个性化服务等。未来,AIGC将在各行各业创造巨大价值,推动社会进入更加智能化的时代。同时,文章也探讨了AIGC对开发者的影响,以及其可能无法完全取代人类的原因,强调开发者可以利用AIGC提升工作效率。
48 0
|
4月前
|
机器学习/深度学习 数据采集 人工智能
作为AIGC技术的一种应用-bard
8月更文挑战第22天
71 15
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
下一篇
DataWorks