Class 1 达摩院视觉AI技术应用探索

简介: 阿里云高校计划视觉AI五天训练营教程

打卡截图:

一、视觉生产——定义

通过一个/一系列视觉过程,产出新的视觉表达。
产出:人或机器能够感知的图像视频,而不是标签或特征;
要求:新的,和输入不一样的。
输入(参数/素材)——>过程(视觉生产)——>产出(素材/成品)

二、视觉生产——分类

1.生成:从0到1
2.拓展:从1到N
3.摘要:从N到1
4.升维:从An到An+1(比如2D到3D,静态到动态等)
5.增强/变换:从A到B(改)
6.插入/合成:A+B=C(增)
7.擦除:A-B=C(删)

三、视觉生产——通用基础框架

(请求)输入(参数、素材等)
(分发)生产类型(通用生成、素材合成等)
(服务)视觉生产引擎(生成引擎、搜索引擎)
(响应)输出图像/视频/3D(素材、案例等)

四、视觉生产——五个关键维度(由下至上,由浅入深)

  • 带来用户/商业价值(可用)
  • 提供用户预期的抓手(可控)
  • 保证结果的丰富性(多样)
  • 合乎语义/内容逻辑(合理)
  • 满足视觉/美学表现(可看)

五、精细理解——分割抠图

识别:知道是什么
检测:识别+知道在哪儿
分割:识别+检测+每一个像素是什么

六、视觉生成——框架流程

1.理需求
2.定草图
3.选状态
4.调细节
5.生成图
6.评好坏

素材准备——基础特——智能特效——智能编排

七、视觉编辑






视觉植入:可实现在视频里进行文字、图片的拼接插入或者删除
画幅变化:调整画幅比例、图片尺寸等
八、视觉增强(分辨率、帧率、色彩)



人脸修复增强、渲染图超分、视频超分、插帧、HDR色彩扩展、风格迁移

九、视觉制造


实体设计制造、服装几何生成、多样性拓展等

十、视觉智能开放平台

视觉开放平台

相关文章
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
QwQ-32B为襄阳职业技术学院拥抱强化学习的AI力量
信息技术学院大数据专业学生团队与UNHub平台合作,利用QwQ-32B模型开启AI教育新范式。通过强化学习驱动,构建职业教育智能化实践平台,支持从算法开发到应用的全链路教学。QwQ-32B具备320亿参数,优化数学、编程及复杂逻辑任务处理能力,提供智能教学助手、科研加速器和产教融合桥梁等应用场景,推动职业教育模式创新。项目已进入关键训练阶段,计划于2025年夏季上线公测。
63 10
QwQ-32B为襄阳职业技术学院拥抱强化学习的AI力量
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术如何重塑客服系统?解析合力亿捷AI智能客服系统实践案例
本文探讨了人工智能技术在客服系统中的应用,涵盖技术架构、关键技术和优化策略。通过感知层、认知层、决策层和执行层的协同工作,结合自然语言处理、知识库构建和多模态交互技术,合力亿捷客服系统实现了智能化服务。文章还提出了用户体验优化、服务质量提升和系统性能改进的方法,并展望了未来发展方向,强调其在客户服务领域的核心价值与潜力。
27 6
|
18天前
|
人工智能 智能设计 物联网
阿里云设计中心携手金鸡电影节青年创作人,用AI技术加速电影工业升级
阿里云设计中心携手金鸡电影节青年创作人,用AI技术加速电影工业升级
|
18天前
|
存储 人工智能 云计算
第六届中国计算机教育大会,AI时代下设计与技术的再生。
第六届中国计算机教育大会,AI时代下设计与技术的再生。
|
22天前
|
人工智能 Java API
Java也能快速搭建AI应用?一文带你玩转Spring AI可落地性
Java语言凭借其成熟的生态与解决方案,特别是通过 Spring AI 框架,正迅速成为 AI 应用开发的新选择。本文将探讨如何利用 Spring AI Alibaba 构建在线聊天 AI 应用,并实现对其性能的全面可观测性。
|
17天前
|
人工智能 弹性计算 Ubuntu
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
本文介绍了如何使用阿里云提供的DeepSeek-R1大模型解决方案,通过Chatbox和Dify平台调用百炼API,实现稳定且高效的模型应用。首先,文章详细描述了如何通过Chatbox配置API并开始对话,适合普通用户快速上手。接着,深入探讨了使用Dify部署AI应用的过程,包括选购云服务器、安装Dify、配置对接DeepSeek-R1模型及创建工作流,展示了更复杂场景下的应用潜力。最后,对比了Chatbox与Dify的输出效果,证明Dify能提供更详尽、精准的回复。总结指出,阿里云的解决方案不仅操作简便,还为专业用户提供了强大的功能支持,极大提升了用户体验和应用效率。
896 19
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
|
9天前
|
人工智能 前端开发 JavaScript
AI程序员:通义灵码 2.0应用VScode前端开发深度体验
AI程序员:通义灵码 2.0应用VScode前端开发深度体验,在软件开发领域,人工智能技术的融入正深刻改变着程序员的工作方式。通义灵码 2.0 作为一款先进的 AI 编程助手,与广受欢迎的代码编辑器 Visual Studio Code(VScode)相结合,为前端开发带来了全新的可能性。本文将详细分享通义灵码 2.0 在 VScode 前端开发环境中的深度使用体验。
117 2
|
3天前
|
Web App开发 人工智能 机器人
牛逼,这款开源聊天应用竟能一键召唤多个AI助手,跨平台通话神器!
`JiwuChat`是一款基于Tauri2和Nuxt3构建的轻量化多平台即时通讯工具,仅约8MB体积却集成了**AI群聊机器人**、**WebRTC音视频通话**、**屏幕共享**等前沿功能。一套代码适配Windows/macOS/Linux/Android/iOS/Web六大平台,堪称开发者学习跨端开发的绝佳样板!
|
1天前
|
人工智能 运维 Serverless
一键轻松打造你的专属AI应用!
函数计算提供免运维、Serverless GPU,具备极致弹性与按量付费优势,助您一键部署AI大模型,加速业务创新。
|
21天前
|
人工智能 边缘计算 运维
容器化浪潮下的AI赋能:智能化运维与创新应用
近年来,容器技术以其轻量、高效、可移植的特性成为云原生时代的基石,推动应用开发和部署方式革新。随着容器化应用规模扩大,传统运维手段逐渐力不从心。AI技术的引入为容器化生态带来新活力,实现智能监控、自动化故障诊断与修复及智能资源调度,提升运维效率和可靠性。同时,AI驱动容器化创新应用,如模型训练、边缘计算和Serverless AI服务,带来更多可能性。未来,AI与容器技术的融合将更加紧密,推动更智能、高效的运维平台和丰富的创新应用场景,助力数字化转型。

热门文章

最新文章