阿里云视觉训练-第一天

简介: 视觉生成定义:通过一个/一系列视觉过程,产出新的视觉表达。产出的是人或机器能够感知的图像或视频,而不是特征或标签。

阿里视觉生产学习笔记

视觉生产定义
通过一个/一系列视觉过程,产出新的视觉表达。产出的是人或机器能够感知的图像或视频,而不是特征或标签。
视觉生产过程
1.png
视觉生产分类
生成、拓展、摘要、升维、增强/变换、插入/合成、擦除
视觉生产通用基础框架
2.png

视觉生产应用
3.png

图像分割
图像生成
平面图像生成
5.png

视频编辑
包括视频文字擦除、视频植入、视频检测与定位、视频插帧

视觉增强

包括HDR色彩拓展、风格迁移

我作为萌新,很开心能够参加阿里云视觉培训,感谢阿里!!明天继续加油!

目录
相关文章
|
7月前
|
数据采集 人工智能 自然语言处理
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
【8月更文挑战第29天】豆包大模型与香港大学团队合作研发的ByteCheckpoint系统,旨在应对大语言模型(LLM)开发中的数据规模庞大、计算资源昂贵及训练过程不稳定的挑战。该系统通过统一检查点机制、细粒度资源管理和多模态数据处理等创新技术,显著提升了LLM的训练效率和模型性能,并已在多个实际场景中取得显著效果。
149 4
|
6月前
|
机器学习/深度学习 人工智能 供应链
【通义】AI视界|OpenAI的“草莓”模型预计两周内上线!像人类一样思考!
本文介绍了近期科技领域的五大亮点:OpenAI即将推出的新一代AI模型“草莓”,具备高级推理能力;亚马逊测试AI技术加速有声读物生产,通过语音克隆提高效率;Kimi API新增联网搜索功能,拓宽信息来源;顺丰发布物流行业专用大语言模型“丰语”,提升工作效率;钉钉推出“AI班级群”功能,改善家校沟通体验。更多详情,请访问[通义官网]。
|
编解码 数据可视化 物联网
基于 PPDiffusers 训练 AIGC 趣味模型【中国美食与花】
基于 PPDiffusers 训练 AIGC 趣味模型【中国美食与花】
136 0
|
数据采集 人工智能 算法
ECCV 2022 | 76小时动捕,最大规模数字人多模态数据集开源
ECCV 2022 | 76小时动捕,最大规模数字人多模态数据集开源
235 0
|
人工智能 C++
AI在线求鼓励?这些人一句话让GPT-3算术准确率提升61%(2)
AI在线求鼓励?这些人一句话让GPT-3算术准确率提升61%
180 0
|
机器学习/深度学习 人工智能 自然语言处理
AI在线求鼓励?这些人一句话让GPT-3算术准确率提升61%(1)
AI在线求鼓励?这些人一句话让GPT-3算术准确率提升61%
150 0
|
机器学习/深度学习 编解码 自然语言处理
只需2040张图片,训练视觉Transformer:南大吴建鑫团队提出IDMM
只需2040张图片,训练视觉Transformer:南大吴建鑫团队提出IDMM
211 0
|
人工智能 Python
百度飞桨图像分类------第一天(实现各类图像增广)
百度飞桨图像分类------第一天(实现各类图像增广)
百度飞桨图像分类------第一天(实现各类图像增广)
|
机器学习/深度学习 人工智能 自然语言处理
一周AI最火论文 | 拟合力学模型,谷歌教机器人用5分钟的数据get多种运动技能
一周AI最火论文 | 拟合力学模型,谷歌教机器人用5分钟的数据get多种运动技能
168 0
|
人工智能 文字识别 前端开发
AI视觉第二天
AI视觉第二天,身份证识别系统搭建笔记。
187 0
AI视觉第二天