AI视觉训练营——第一天学习记录

简介: 1、视觉生产2、分割抠图3、视觉生成4、视觉编辑5、视觉增强6、视觉制造

一、视觉生产
1、定义

通过一个/一系列视觉过程,产出新的视觉表达


· 视觉生产,把抽象的内容通过一系列算法转变成具象的内容,如视频,图片等。
2、分类

视觉生产分为 “生成 0->1”、“拓展 1->N”、“摘要 N->1”、“升维 An->An+1” 四个过程。另外还包括 “增强变换 A->B”,”插入合成 A+B->C“,“擦除 A-B->C”。


3、通用基础框架

Request (请求):


输入: 参数,素材,草案,成品,案例


Dispatch (分发):


生产类型:调用生成,素材合成,照图生图,视频摘要,编辑变换,视觉拓展


Service (服务):


视觉生产引擎:搜索引擎( 素材,案例 )<=>生成引擎( 模型,知识 )


Response (响应):


输出:图像,视频,案例


二、分割抠图
生产必要的前置步骤

识别:辨认内容


检测:确定图中识别对象内容


分割:精确到像素,对图片内的全部内容做区分


1、分割思路

1、复杂问题拆解:粗mask+精准matting


2、丰富数据样本:设计图象mask统一模型


运用 Semantic Segmentation 技术给图片添加蒙版


Instance Segmentation 技术给蒙版划分通道,这两项合称为Mask


Image Matting 将粗分割模型与精分割网络结合,精确辨认图像


2、分割模型
分割模型.png
三、视觉生成

通过视觉生成,让智能AI服务于工作。满足照图生图,海报广告设计,自动剪辑视频的个性化需求。

1、框架流程
视觉生成框架.png
2、视频生成-框架
视频合成.png
四、视觉编辑


植入广告:在视频中插入广告且与上下文内容不冲突


分镜检测,广告位检测,广告位跟踪,遮挡检测,素材匹配,光影渲染



字母擦除,台标擦除,广告擦除,场景文字擦除,人体擦除


擦除.png



画幅变化(变化视频分辨率,变化图片尺寸,保留内容)


五、视觉增强

修复画质,人脸修复,放大小图,视频分辨率,视频补帧,HDR色彩拓展(直观上增加像素对比度),风格迁移(如帆布效果,风格化),颜色拓展(在颜色合理搭配的情况下生成多样化的配色方案)


六、视觉制造

核心逻辑


视觉生产.png


可以运用在模拟包装盒打包,生成多样化服饰等领域

Capgras
+关注
目录
打赏
0
0
0
0
2
分享
相关文章
HarmonyOS NEXT AI基础视觉服务-背景替换
这是一个基于AI基础视觉服务的背景替换案例,通过调用设备相册选择图片并智能分割主体,支持动态更换背景颜色。主要步骤包括:1) 导入模块与定义组件;2) 实现图片选择与格式转换;3) 使用`subjectSegmentation.doSegmentation`接口完成主体分割;4) 通过随机RGB值实现背景色动态更换。代码结构清晰,功能完整,适合学习AI图像处理技术。
HarmonyOS NEXT AI基础视觉服务-背景替换
HarmonyOS NEXT AI基础视觉服务-人脸对比
这是一套基于AI基础视觉服务实现的人脸对比系统,用户可通过调用设备相册选择两张图片,系统将提取人脸特征并计算相似度,最终以结构化数据形式展示对比结果(如相似度值和是否为同一人)。代码涵盖模块导入、双图选择、图像处理、人脸对比核心逻辑及UI界面构建,支持异常处理与权限管理,确保功能稳定性和兼容性。适配场景包括身份验证、人脸匹配等,具有较高的实用价值。
HarmonyOS NEXT AI基础视觉服务-人脸对比
HarmonyOS NEXT AI基础视觉服务-人脸识别
这是一个基于AI基础视觉服务的人脸识别案例,通过调用设备相册选择图片,利用MediaLibraryKit、ImageKit和CoreVisionKit等模块完成图像处理与人脸检测,并展示结构化结果。核心功能包括:相册访问授权、图像数据转换、人脸位置及特征点检测,最终以弹窗形式输出检测信息。代码涵盖模块导入、功能实现与UI构建,适合学习AI视觉应用开发流程。
HarmonyOS NEXT AI基础视觉服务-文字识别
本案例展示了一款基于AI基础视觉服务的文字识别应用,通过调用设备相机拍摄照片并识别图片中的文字内容。主要实现步骤包括:1) 导入所需功能模块;2) 调用相机获取图片URI;3) 将图片转换为可识别的像素图;4) 配置视觉识别参数并执行文字识别;5) 构建界面组件,实现拍照与结果显示交互。核心要点涵盖相机权限、图像格式兼容及结构化识别结果处理,完整代码整合了各功能模块的调用流程,确保功能顺畅运行。
AI思维导图工具跨领域学习的好帮手
AI思维导图工具跨领域学习的好帮手
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
114 1
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
【01】AI制作音乐之三款AI音乐软件推荐,包含AI编曲-AI伴奏-AI混音合成remix等-其次关于音乐版权的阐述-跟随卓伊凡学习如何AI制作音乐-优雅草卓伊凡
【01】AI制作音乐之三款AI音乐软件推荐,包含AI编曲-AI伴奏-AI混音合成remix等-其次关于音乐版权的阐述-跟随卓伊凡学习如何AI制作音乐-优雅草卓伊凡
403 14
一场静默的教育革命正在发生:AI如何重塑学习与教学
生成式人工智能(Generative AI)正深刻改变教育领域,从学生到职场人士,AI逐渐成为必备技能。文章探讨了AI在教育中的应用与挑战,如认知卸载现象及批判性思维能力下降,并提出通过GAI认证提升AI技能的标准化途径。未来教育将形成“师、机、生”三元结构,强调人与AI协作共进。掌握AI技术不仅是职业发展的关键,更是教育革命中的核心推动力。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
242 58
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

热门文章

最新文章