备案控制台

开发者社区人工智能文章正文

视觉AI技术应用探索学习笔记

2020-09-24 817

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 第一天-应用探索学习笔记

定义

通过一个/一系列视觉过程，产生新的视觉表达

分类

生成：从0到1
扩展：从1到N
摘要：从N到1(把主要的信息浓缩起来)
升维：从An到An+1
增强/变换:从A到B
插入/合成: A+B = C
擦除: A-B=C

基础通用框架

五个关键维度

视觉生产要满足5个规范要求才是一个好的视觉

满足视觉,美学表现符合人们的审美
合乎语义,内容逻辑
保证结果的丰富性
提供用户预期的抓手，让用户可以添加一些控制因素
要具有商业价值

精细理解-分割抠图

识别：知道是什么
检测：识别+知道在哪儿（缺陷检测，多目标检测）
分割：识别+检测+知道每个像素是什么(全景分割,病灶分割)（视觉分割时生产的必要前置步骤）

分割抠图难点

复杂背景
遮挡
发丝精抠
边缘反色
多尺度/目标
数据不足

分割思路

思路

复杂问题拆解:mask估计+精准matting
丰富数据样本:设计图像mask同一模型

类型

语义分割(Semantic Segmentation):分析出事什么东西，比如是个人
实例分割(Instance Segmentation):分析出这个人是谁
图像抠图技术(Image Matting):处理图像

模型框架

从无到有

鹿班

功能：平面图像设计生成

框架流程

AlibaabWood

功能：短视频设计生成

框架流程

视频编辑-移花接木

应用方面

视频植入
动态监测分割
视频内容擦除
- 文字擦除
- Logo擦除
画幅变化
图像尺寸变化

视觉增强-修旧如新

核心逻辑

应用方面

人脸修复增强
渲染图超分
视频超分
视频插帧
HDR色彩扩展
风格迁移
颜色扩展

视觉制造-由虚入实

核心逻辑

应用方面

包装几何生成
服装几何生成
视觉迁移及融合
多样性拓展
2D3D融合

视觉智能开放平台

集合上面的一些视觉功能以及其他的功能，网址vision.aliyun.com

文章标签：

智能设计

人工智能

关键词：

AI视觉

AI技术

AI应用

AI技术应用

视觉AI

游客wnegaeyv3whwq

目录

相关文章

TsingtaoAI

|

5天前

|

机器学习/深度学习人工智能自动驾驶

企业内训｜AI大模型在汽车行业的前沿应用研修-某汽车集团

本课程是TsingtaoAI为某汽车集团高级项目经理设计研发，课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练，学员将全面掌握机器学习、深度学习、NLP与CV等核心技术，了解自动驾驶、智能制造、车联网与智能营销等关键应用场景，洞悉AI技术对企业战略布局的深远影响。

TsingtaoAI

131 97 100

蚝油菜花

|

2天前

|

机器学习/深度学习人工智能自然语言处理

CogAgent-9B：智谱 AI 开源 GLM-PC 的基座模型，专注于预测和执行 GUI 操作，可应用于自动化交互任务

CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型，支持高分辨率图像处理和双语交互，能够预测并执行GUI操作，广泛应用于自动化任务。

蚝油菜花

31 12 12

CogAgent-9B：智谱 AI 开源 GLM-PC 的基座模型，专注于预测和执行 GUI 操作，可应用于自动化交互任务

灵杰开发者

|

2天前

|

数据采集人工智能运维

从企业级 RAG 到 AI Assistant，阿里云Elasticsearch AI 搜索技术实践

本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案

灵杰开发者

37 3 3

从企业级 RAG 到 AI Assistant，阿里云Elasticsearch AI 搜索技术实践

蚝油菜花

|

20小时前

|

人工智能 UED

VersaGen：生成式 AI 代理，基于 Stable Diffusion 生成图像，专注于控制一至多个视觉主体等生成细节

VersaGen 是一款生成式 AI 代理，专注于文本到图像合成中的视觉控制能力，支持多种视觉控制类型，并通过优化策略提升图像生成质量和用户体验。

蚝油菜花

19 8 8

VersaGen：生成式 AI 代理，基于 Stable Diffusion 生成图像，专注于控制一至多个视觉主体等生成细节

Echo_Wish

|

4天前

|

机器学习/深度学习数据采集人工智能

AI在用户行为分析中的应用：实现精准洞察与决策优化

AI在用户行为分析中的应用：实现精准洞察与决策优化

Echo_Wish

42 15 15

技术内容小助手

|

3天前

|

人工智能资源调度调度

云上AI Infra解锁大模型创新应用

本节课程由阿里云智能集团资深技术专家王超分享，主题为AI基础设施的发展趋势。课程聚焦于AI Infra设计与Scaling Law，探讨了下一代AI基础设施的设计目标、功能升级及推理场景中的应用。主要内容包括高效支持大规模模型训练和推理、全球调度系统的设计、Rack level的Scale优化以及多租户容器化使用方式。通过这些改进，旨在提升并行效率、资源利用率及稳定性，推动AI基础设施迈向更高性能和更优调度的新阶段。

技术内容小助手

19 2 2

TsingtaoAI

|

4天前

|

机器学习/深度学习人工智能自然语言处理

师资研修｜AI技术赋能教材建设和课程开发——乌鲁木齐某教育部门

近日，TsingtaoAI派出AI专家为乌鲁木齐中职院校的教师团队，举办“AI技术赋能教材建设与课程开发”的师资研修。此次培训由TsingtaoAI的AI专家高寒和教育专家刘建老师亲自授课，面对的是来自乌鲁木齐的教育工作者，特别是中职院校的教学骨干。整个活动不仅涉及人工智能技术本身的深度解析，还深入探讨了如何将这些前沿技术高效应用于教材和课程体系的创新。

TsingtaoAI

27 0 0

飒龘

|

机器学习/深度学习新零售人工智能

阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索

在这个人工智能已经普及的时代，各行各业都充斥着AI的身影。大部分人认为人工智能起点高，入门难，想要使用AI服务又无法独立完成编写，开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式，快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力，为其提供高易用、普惠的视觉API服务，帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。

飒龘

1304 0 1

阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索

魏尔肖

|

人工智能前端开发算法

视觉AI五天训练营教程 Day 3

简介：在这个人工智能已经普及的时代，各行各业都充斥着AI的身影。大部分人认为人工智能起点高，入门难，想要使用AI服务又无法独立完成编写，阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验，面向视觉智能技术企业和开发商（含开发者），为其提供高易用、普惠的视觉API服务，帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式，快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力。本期直播将带你

魏尔肖

578 0 0

视觉AI五天训练营教程 Day 3

飒龘

|

编解码人工智能文字识别

阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统

本文介绍了如何使用阿里云视觉智能开放平台相关服务的PHP SDK，具体包括SDK的获取和安装方法以及SDK代码示例。

飒龘

468 0 0

阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统

热门文章

最新文章

一个模型走天下！智源提出全新扩散架构OmniGen，AI生图进入一键生成时代

预告 | 阿里云邀您参加2024中国生成式AI大会上海站，马上报名

通义千问开源的QwQ模型，一个会思考的AI，百炼邀您第一时间体验

12月更文特别场——寻找用云高手，分享云&AI实践

底层技术大揭秘！AI智能导购如何重塑购物体验

OpenAI 12天发布会全解析 | AI大咖说

加速数据处理与AI开发的利器：阿里云MaxFrame实验评测

教你自创工作流，赋予AI助理个性化推荐超能力

限时优惠体验！DataWorks数据治理中心全新升级为数据资产治理

阿里云百炼又获大奖！阿里云百炼入选 2024 最受开发者欢迎的 AI 应用开发平台榜15强

Fireworks AI和MongoDB：依托您的数据，借助优质模型，助力您开发高速AI应用

生成式AI入门必读：基本概念、数据挑战与解决方案

夏日主题 AI创造挑战活动来了！

[译][AI OpenAI-doc] 延迟优化

新一代数据库技术：融合AI的智能数据管理系统

AI回答总不满意？你的提问方式可能完全错误！

AI工具-标注工具labelme

[译][AI OpenAI-doc] 安全最佳实践

构建高效AI系统：深度学习优化技术解析

构建未来：AI在持续学习系统中的创新应用

相关课程

更多

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

趣味视觉AI应用入门与实战

AI数学基础

相关电子书

更多

Lindorm AI 能力介绍

2023云栖大会：PolarDB for AI

2023云栖大会：Lindorm一站式AI数据平台实战

相关实验场景

更多

体育赛事！零代码生成运动风格AI写真。

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

使用容器计算服务 ACS 算力快速搭建生成式 AI 会话应用

SAE 极速部署专属 AI 证件照神器

流水线运行出错排查难？AI帮你智能排查

以电商场景为例搭建AI语义搜索应用

下一篇

阿里云无影云电脑免费试用，最长可试用3个月