开发者社区精选直播合集 | 众享视觉AI合集

本文涉及的产品
视觉智能开放平台,图像通用资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频通用资源包5000点
简介: 视觉AI是AI技术的一个重要领域,是指利用AI实现计算机视觉目的的技术。随着中国加工制造业的发展,智能视觉的需求逐渐增多,它在许多领域有很好的发展前景。想投身视觉AI?快速了解它的技术发展现状及优秀应用案例?本合集给你献上!

image.png

让天下没有难用的视觉AI技术

image.png
讲师:任健强 | 阿里巴巴达摩院算法专家
推荐理由:阿里巴巴算法专家雪洛为你揭秘达摩院AI研发同学的日常工作内容与体验,以及达摩院在视觉AI方面的探索和应用成果,并独家发布阿里云视觉AI开发秘籍——《15分钟开发视觉AI应用》电子书,助你快速上手视觉智能AI开放平台,借达摩之力,成为AI高手。 戳我观看

3D图形赋能下的视觉新制造

image.png
讲师:马菲莹 | 达摩院高级算法专家
推荐理由:随着5G时代的到来,视觉制造将进一步将3D图形和AI技术相结合,打造智能、标准化的高质量数字内容生产流程,让“设计”与“制造”直联互通。本视频从服装和包装两个行业切入,为你从2D到3D的模型自动生成、2D与3D的融合等关键技术中划重点,同时给你分享阿里云官网对外开放的视觉智能平台相关技术和功能,共同探讨视觉新制造的发展和未来。 戳我观看

视觉生产技术实践及视觉公共云能力建设

image.png
讲师:星瞳 | 达摩院资深算法专家
推荐理由:如今视觉智能在应用上具有广泛性,能够在智能制造,以及众多智能生活领域展开应用。本视频就从视觉生产的分类、技术发展、应用方向、未来前景分享经验和观点,通过团队的实践应用中的典型案例,分享视觉分割、生成、增强、编辑等细分方向的技术成果和经验,并让你了解如何通过阿里云视觉智能开放平台去服务广泛的集团内外的需求!戳我观看

阿里云行业视觉智能诊断技术及落地案例

image.png

讲师:金智勇 | 达摩院算法专家
推荐理由:本视频给你分享阿里巴巴达摩院视觉AI技术在工业质检、厂区安全、人脸人体应用等方面的技术。通过对光伏、食品、化工、机场、司法、教育等多个行业典型场景实际落地产品和解决方案的介绍,为开发者和生态合作伙伴提供视觉AI领域业务拓展的思路!戳我观看

快速使用 Serverless 工作流 + 阿里云视觉智能开放平台构建人工智能服务应用

image.png
讲师:阿里云视觉智能开发平台团队
推荐理由:近几年人工智能一直是热度很高的话题,AI越来越多的出现在实际生活的场景中,大家也能感受到它所带来的便利。这些应用所用到的核心 AI 基础算法是一样的,如人脸人体检测、卡证识别等。阿里云视觉智能开放平台与Serverless工作流进行了深度的合作,通过Serverless工作流将平台上的AI算法进行了集成,相比于之前用户需要手动编写API调用的处理逻辑并处理异常的情况,现在可以直接将智能开放平台的API算法调用作为流程中的一个步骤进行处理,并将结果数据传递到后续的流程中。具体如何操作,本视频为你一一介绍! 戳我观看

往期精选合集回顾

AI直播合集
架构师成长秘籍
玩转 Serverless 合集
AIoT实践精选合集
玩转DevOps集锦
容器化时代
机器学习实践篇
拥抱云计算
K8s从入门到精通
微服务架构与实践
数据库合集
云原生时代的数据库
众享视觉AI合集
大数据加油包合集
小程序,大世界
目录
相关文章
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
|
6月前
|
人工智能 计算机视觉
HarmonyOS NEXT AI基础视觉服务-背景替换
这是一个基于AI基础视觉服务的背景替换案例,通过调用设备相册选择图片并智能分割主体,支持动态更换背景颜色。主要步骤包括:1) 导入模块与定义组件;2) 实现图片选择与格式转换;3) 使用`subjectSegmentation.doSegmentation`接口完成主体分割;4) 通过随机RGB值实现背景色动态更换。代码结构清晰,功能完整,适合学习AI图像处理技术。
HarmonyOS NEXT AI基础视觉服务-背景替换
|
6月前
|
存储 人工智能 数据安全/隐私保护
HarmonyOS NEXT AI基础视觉服务-人脸对比
这是一套基于AI基础视觉服务实现的人脸对比系统,用户可通过调用设备相册选择两张图片,系统将提取人脸特征并计算相似度,最终以结构化数据形式展示对比结果(如相似度值和是否为同一人)。代码涵盖模块导入、双图选择、图像处理、人脸对比核心逻辑及UI界面构建,支持异常处理与权限管理,确保功能稳定性和兼容性。适配场景包括身份验证、人脸匹配等,具有较高的实用价值。
HarmonyOS NEXT AI基础视觉服务-人脸对比
|
6月前
|
人工智能 计算机视觉
HarmonyOS NEXT AI基础视觉服务-人脸识别
这是一个基于AI基础视觉服务的人脸识别案例,通过调用设备相册选择图片,利用MediaLibraryKit、ImageKit和CoreVisionKit等模块完成图像处理与人脸检测,并展示结构化结果。核心功能包括:相册访问授权、图像数据转换、人脸位置及特征点检测,最终以弹窗形式输出检测信息。代码涵盖模块导入、功能实现与UI构建,适合学习AI视觉应用开发流程。
|
6月前
|
人工智能 文字识别 计算机视觉
HarmonyOS NEXT AI基础视觉服务-文字识别
本案例展示了一款基于AI基础视觉服务的文字识别应用,通过调用设备相机拍摄照片并识别图片中的文字内容。主要实现步骤包括:1) 导入所需功能模块;2) 调用相机获取图片URI;3) 将图片转换为可识别的像素图;4) 配置视觉识别参数并执行文字识别;5) 构建界面组件,实现拍照与结果显示交互。核心要点涵盖相机权限、图像格式兼容及结构化识别结果处理,完整代码整合了各功能模块的调用流程,确保功能顺畅运行。
|
8月前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
288 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
7月前
|
存储 人工智能 安全
有奖体验 AI 模特换装,解锁电商视觉新体验
在电商中,制作精美的商品展示图成本高且流程复杂。AI 换装技术允许商家快速更换模特的服装或配件,无需重新拍摄,大大缩短准备时间。这项技术减少了对专业摄影师和后期团队的依赖,使中小商家也能轻松产出高质量的商品图片,灵活响应市场变化,有效降低成本,提升竞争力。本方案利用函数计算 FC 构建 Web 服务,采用百炼视觉模型 qwen-vl-max-latest、aitryon、aitryon-refiner、shoemodel-v1 来分别实现 AI 人物主体信息提取、模特试衣、试衣精修、模特换鞋。
|
7月前
|
存储 人工智能 安全
有奖体验 AI 模特换装,解锁电商视觉新体验
有奖体验 AI 模特换装,解锁电商视觉新体验
有奖体验 AI 模特换装,解锁电商视觉新体验
|
8月前
|
人工智能 UED
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
VersaGen 是一款生成式 AI 代理,专注于文本到图像合成中的视觉控制能力,支持多种视觉控制类型,并通过优化策略提升图像生成质量和用户体验。
172 8
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
|
9月前
|
人工智能 API 数据库
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
Browser Use 是一款专为大语言模型设计的智能浏览器工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。
2634 0
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能