阿里云视觉AI 5天实践训练营

简介: 视觉生产技术探索和应用简单介绍

1.视觉生产技术分类
生成:从无到有。
拓展:已经存在,拓展到更多。
摘要:浓缩在一起,提取出重要的部分。
升纬:比如图像为2D,加上时间轴,就是2D加t。也 可以是2D变3D。
增强/变换:一张图通过增强或者变换得到另一张图。
插入/合成:两张图合成或者一张图插入一些内容。
擦除:就是去除一些内容。
2.视觉生产—通用基础框架
截屏2020-09-24 上午11.25.47.png

3.五个关键纬度
可看:满足美学表现。
合理:符合逻辑和语义。
多样:结果丰富多样。
可控:用户提供参数可控结果。
可用:可以实际应用。
4.分割
想要进行视觉生产最基础的就是分割。分割分为三步,第一步是识别需要知道这张图是什么?第二步,检测需要知道问题和处理的地方在哪?第三步就是分割,知道每个像素都是些什么东西,分割的难点在于数据不足,标注成本高。
分割大概有三种,第一是语义分割知道他是什么类型的,比如知道一张图片里面这是一个人。第二个是实例分割,比如知道那个人是谁?第三个是Matting。对于一些较难的复杂问题,一般进行拆分方法先粗mask估计,然后再精准的maltting。
5.视觉生成
除了分割,还有从无到有即视觉生成,比如有视频摘要,将视频中的重要部分选出来。视觉编辑,即可以在视频中加入植入等,其它的还有动态分割,将视频中指定的物品配出来、视频内容擦除,比如擦掉模糊的字幕,logo等。还有画幅变化、图像尺寸变化等。
6.视觉增强
视频增强、人脸修复、视频插帧、HDR色彩扩展、风格迁移、颜色拓展等。
7.视觉制造
几何生成,和传统工业相结合、视觉迁移、多样性拓展等
以短视频设计生成平台——为例
框架流程
1、 准备素材(场景选择、关联商品、素材准备、参数设置)
2、 视频算法(可以使用编辑器微调。核心)

3、 渲染合成(将已编排好的视频进行视频合成后渲染出成品)
4、 投放上传平台

视频摘要
将生成的视频或原已有的视频或多个视频进行关键摘要(如15秒摘要,30秒摘要,60秒摘要等)

视频封面
图像增强:在内容理解的基础上对图片进行裁剪和组合。
内容分析:通过AI的分析功能来对全视频进行内容分析和挑选。
质量审核:将模糊、曝光等低质量图像进行过滤。

完成以上一系列操作后来抓取生成多帧静止图或动图。随后可以进行各个平台的分发。

视觉编辑
视频植入
PS:我个人认为这个功能比较有意思
场景:电视剧植入、电影植入、综艺植入等。
可以将广告内容与宿体内容本身不太符合的广告以没有太多【违和感】的形式植入,使广告的植入范围变得更广,大大提升了广告的植入效率,并且不会给用户造成太大的反感。

目录
相关文章
|
4月前
|
人工智能 文字识别 监控
|
4月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3100 166
|
4月前
|
人工智能 IDE Java
AI Coding实践:CodeFuse + prompt 从系分到代码
在蚂蚁国际信贷业务系统建设过程中,技术团队始终面临双重考验:一方面需应对日益加速的需求迭代周期,满足严苛的代码质量规范与金融安全合规要求;另一方面,跨地域研发团队的协同效率与代码标准统一性,在传统开发模式下逐渐显现瓶颈。为突破效率制约、提升交付质量,我们积极探索人工智能辅助代码生成技术(AI Coding)的应用实践。本文基于蚂蚁国际信贷技术团队近期的实际项目经验,梳理AI辅助开发在金融级系统快速迭代场景中的实施要点并分享阶段性实践心得。
990 25
AI Coding实践:CodeFuse + prompt 从系分到代码
|
4月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
4月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
4月前
|
人工智能 新制造
TsingtaoAI受邀参加宁波AI海曙科创训练营并分享技术落地实践
10月12日至15日,由宁波市海曙区组织部主办的AI海曙科创训练营在宁波成功举办。作为受邀企业代表,TsingtaoAI团队深入参与了多项活动,与政府领导、行业专家及科创企业代表围绕AI技术在制造业、成果转化等领域的实际应用展开交流,用真实案例诠释了“技术扎根产业”的价值逻辑。
137 2
|
4月前
|
数据采集 存储 人工智能
从0到1:天猫AI测试用例生成的实践与突破
本文系统阐述了天猫技术团队在AI赋能测试领域的深度实践与探索,讲述了智能测试用例生成的落地路径。
从0到1:天猫AI测试用例生成的实践与突破
|
4月前
|
人工智能 安全 开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
929 24

热门文章

最新文章