|
机器学习/深度学习 人工智能 自然语言处理
|

借助AIGC实现人物写真和服装试穿

大家都知道,最近两名人工智能技术的高速发展,让越来越多的企业开始关注如何将人工智能技术应用到自己的业务中。阿里云作为业内领先的云计算服务提供商,其智能开放平台在人工智能领域的技术积累和应用能力方面处于领先地位。接下来将结合阿里云的视觉智能开放平台来聊一下借助AIGC实现人物写真和服装试穿等功能。

756 1
|
人工智能 Serverless 开发者
|

AIGC-无限创作

讲述基于函数计算的AIGC部署及ChatGPT部署

785 1
来自: 视觉生产  版块
|
编解码 人工智能 PyTorch
|

Stable Diffusion如何生成高质量的图-prompt写法介绍

Stable Diffusion如何生成高质量的图-prompt写法介绍

1909 2
|
人工智能 API C++
|

【AI绘画大比拼】通义万相VS文心一格:探索十种风格下的绘画生成差异!

近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。 那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。

5674 8
来自: 通义万相  版块
|
vr&ar 计算机视觉
|

REALY头部重建榜单冠军模型HRN解读【OpenVI—论文解读系列】

高保真 3D 头部重建在许多场景中都有广泛的应用,例如 AR/VR、医疗、电影制作等。尽管大量的工作已经使用 LightStage 等专业硬件实现了出色的重建效果,从单一或稀疏视角的单目图像估计高精细的面部模型仍然是一个具有挑战性的任务。 本文中,我们将介绍CVPR2023最新的头部重建论文,该工作在单图头部重建榜单REALY上取得正脸、侧脸双榜第一,并在其他多个数据集中取得了SOTA的效果。

917 6
来自: 人脸人体  版块
|
人工智能 监控 算法
|

【视觉智能AI场景解决方案——智慧物流车牌识别】

随着AI技术的问世,物流行业迎来了速度、准确率、系统化的全方位提升 。通过使用AI识别车牌与车辆功能,物流企业可以实现对车辆的快速、准确的识别,提高物流车辆的管理效率。此外,AI还可以帮助物流企业实现对车辆功能的识别,如车辆类型、载重等,为物流调度提供更加科学的指导。AI识别车牌与车辆功能的应用正日益普及,为智慧物流行业带来了新的发展机遇。

1008 0
来自: 文字识别  版块
|
机器学习/深度学习 图形学 计算机视觉
|

人脸前沿技术分享与探讨

人脸前沿技术分享与探讨

226 0
|
机器学习/深度学习 人工智能 监控
|

人脸前沿技术分享与探讨

随着人工智能的迅速发展,人脸识别技术作为其重要应用之一,正引领着数字时代的潮流。在这个信息爆炸的时代,人脸前沿技术的分享与探讨,成为了科技界和各个行业关注的焦点。本文将以人脸前沿技术为主题,分享人脸识别技术的最新发展,并探讨其在智慧办公、安防、数字营销、互联网娱乐等领域的广泛应用,以及面临的挑战和未来的发展方向。

363 0
|
机器学习/深度学习 人工智能 自动驾驶
|

OpenCV-Python,计算机视觉开发利器

人工智能,一个已经被谈论了几十年的概念(最早是图灵在1950年提出)。如今这几年,相关技术的发展速度是越来越快。高大上如无人驾驶、智能安防、AI辅助诊断,接地气如刷脸支付、内容推荐、自动翻译等,众多领域借助人工智能的力量而进化。从百度搜索指数的变化,也能从一个侧面反映出关注度在不断上升。

537 0
来自: 视觉生产  版块
|
机器学习/深度学习 人工智能 算法
|

Python+OpenCV 十几行代码模仿世界名画

我最近才发现在 OpenCV 的 Sample 代码中就有图像风格迁移的 Python 示例(原谅我的后知后觉),是基于 ECCV 2016 论文中的网络模型实现。所以,即使作为人工智能的菜鸟,也可以拿别人训练好的模型来玩一玩,体会下神经网络的奇妙。

703 0
来自: 视觉生产  版块
|
人工智能 搜索推荐
|

‘通义万相’使用体验——令人惊艳的AI绘画创作大模型

7月7日,阿里云在2023世界人工智能大会上宣布,AI绘画创作大模型通义万相开启定向邀测。通义万相是阿里云“通义”大模型系列第三个产品,此前的通义千问、通义听悟分别具备文字问答和语音文字处理的功能。目前该模型已经开启定向邀测.

11502 9
来自: 通义万相  版块
|
人工智能 API 开发者
|

阿里云视觉智能开放平台官方征稿来啦!

参加阿里云视觉智能开放平台征稿,赢取定制好礼

11236 6
|
机器学习/深度学习 算法 自动驾驶
|

【OpenVI-通用检测系列之图像实例分割】(CVPR 2023)快速实例分割框架FasInst

论文链接:https://arxiv.org/abs/2303.08594

1146 5
|
人工智能 vr&ar
|

【视觉智能AI场景解决方案——AI视频互动娱乐】

如今我们正逐渐进入一个智能化时代,AI视频互动娱乐在娱乐场景中被广泛应用。它利用先进的人工智能技术和互动性强的视频娱乐形式,为用户带来全新的娱乐体验。无论是与虚拟角色互动竞技,还是参与丰富多样的虚拟现实体验,AI视频互动娱乐都能让用户沉浸其中。现如今我们可以在电子游戏、电影、电视节目等传统娱乐形式中见到视觉AI的影子。 那么,AI和我们的生活娱乐中能撞出什么火花?来看看当下最火爆的视频互娱新玩法吧~

1386 3
来自: 视觉生产  版块
|
机器学习/深度学习 存储 编解码
|

【OpenVI—论文解读系列】ICCV | 开源融合不确定度的自监督MVS框架

论文链接:Digging into Uncertainty inSelf-supervised Multi-view Stereo 多视图立体视觉作为计算机视觉领域的一项基本的任务,利用同一场景在不同视角下的多张图片来重构3D的信息。自监督多视角立体视觉(MVS)近年来取得了显著的进展。然而,以往的方法缺乏对自监督MVS中pretext任务提供的监督信号进行有效性的全面解释。本文首次提出在自监督MVS中估计认知不确定性(epistemic uncertainty)。

590 5
|
机器学习/深度学习 传感器 算法
|

【图像分割】基于K-means算法实现遥感图像分类附Matlab代码

【图像分割】基于K-means算法实现遥感图像分类附Matlab代码

1172 0
来自: 图像生产  版块
|
计算机视觉 C++
|

【OpenCv • c++】图像识别边缘检测 图像差分运算

【OpenCv • c++】图像识别边缘检测 图像差分运算

754 0
来自: 图像理解  版块
|
机器学习/深度学习 算法 网络安全
|

【OpenVI—论文解读系列】ICML long talk | 开源半监督学习框架Dash

论文链接:Dash: Semi-Supervised Learningwith DynamicThreolding 本文介绍机器学习顶级国际会议 ICML 2021 接收的 long talk (top 3.02%) 论文 “Dash: Semi-Supervised Learning with Dynamic Thresholding”。

569 5
来自: 人脸人体  版块
|
人工智能 算法 安全
|

【视觉智能AI场景解决方案——智慧考勤】

随着科技和经济的发展,考勤管理制度无论是对于企业还是学习,都是相对重要的管理制度。在传统考勤制度中,员工的出勤和工时需要依靠人工记录,并需要相应的人力来处理和审批。这种方式在浪费了时间和人力成本的基础上,还极易出现数据记录错误,造成一系列严重的后果。现如今,随着视觉智能AI的发展,智慧考勤可以实现。除了可以解决传统的考勤制度中的劣势之外, 还具备完善的数据传输和保存系统,管理者可以更好地利用考勤数据和实时通知系统,更好地规划资源和调整工作安排。

1112 2
来自: 人脸人体  版块
|
机器学习/深度学习 文字识别 算法
|

一文看懂驾驶证识别OCR:从算法到 API 接入代码

随着技术的进一步发展,驾驶证识别 OCR 将继续优化和改进,提升准确性、速度和适应性。它将在智能交通系统、数字化政府服务和商业应用等领域发挥更重要的作用

669 0
来自: 文字识别  版块
|
数据库 Python
|

人脸识别系统

人脸识别系统

330 0
来自: 人脸人体  版块
|
文字识别 小程序 Python
|

图像文字识别与保存-python

图像文字识别与保存-python

224 0
来自: 文字识别  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

「模型即服务AI」1分钟调用SOTA人脸检测,同时搭建时光相册小应用—【OpenVI—代码解读系列】

最近有两个计算机应用发展的方向正在潜移默化的汇拢中:1.)模型即服务 2.)人工智能(AI)。它们的会师正逐渐形成模型即服务AI热潮。 近几年模型即服务一直被人津津乐道,这是提升AI编程效率、加速AI创新应用的大趋势。人工智能领域近几年非常火热,基于AI的行业创新应用层出不穷,尤其今年的AI绘画又大有元年之势,相应介绍可查阅《人工智能内容生成元年—AI绘画原理解析》。如下章节将重点介绍如何通过模型即服务来完成AI功能调用以及相应AI应用搭建。

1690 3
来自: 人脸人体  版块
|
机器学习/深度学习 监控 算法
|

人脸跟踪:基于人脸检测 API 的连续检测与姿态估计技术

基于人脸检测 API 的人脸跟踪技术在视频监控、虚拟现实和人机交互等领域具有广泛应用。通过连续的人脸检测与姿态估计,可以实现对人脸的跟踪和姿态分析。随着深度学习和计算机视觉技术的不断发展,人脸跟踪技术将迎来更加精确、实时和智能化的发展前景

539 0
来自: 人脸人体  版块
|
机器学习/深度学习 监控 算法
|

【OpenVI-通用检测系列之视频目标跟踪】(ICASSP 2023 Oral) 渐进式上下文Transformer跟踪器 ProContEXT

论文链接:https://arxiv.org/pdf/2210.15511.pdf

1095 4
来自: 视觉生产  版块
|
机器学习/深度学习 监控 并行计算
|

m基于PMP投影匹配追踪算法的人体姿态提取matlab仿真

m基于PMP投影匹配追踪算法的人体姿态提取matlab仿真

342 0
来自: 人脸人体  版块
|
机器学习/深度学习 传感器 人工智能
|

图像识别算法汇总

图像识别算法汇总

2525 0
来自: 图像理解  版块
|
机器学习/深度学习 存储 监控
|

人脸识别系统技术方案

人脸识别系统技术方案

1040 0
来自: 人脸人体  版块
|
机器学习/深度学习 数据采集 TensorFlow
|

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(四)

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(四)

641 1
来自: 人脸人体  版块
|
机器学习/深度学习 Serverless TensorFlow
|

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(三)

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(三)

343 0
来自: 人脸人体  版块
|
机器学习/深度学习 TensorFlow 算法框架/工具
|

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(二)

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(二)

525 0
来自: 人脸人体  版块
|
机器学习/深度学习 算法 TensorFlow
|

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(一)

【深度学习】基于卷积神经网络(tensorflow)的人脸识别项目(一)

553 0
来自: 人脸人体  版块
|
计算机视觉
|

Mediapipe三维实时人体关键点检测与追踪(二)

Mediapipe三维实时人体关键点检测与追踪(二)

2575 0
来自: 人脸人体  版块
|
机器学习/深度学习 JavaScript 前端开发
|

Mediapipe三维实时人体关键点检测与追踪(一)

Mediapipe三维实时人体关键点检测与追踪(一)

3137 0
来自: 人脸人体  版块
|
XML JSON 算法
|

【视觉智能产品速递——视频人脸融合产品能力升级】

本文介绍视频生产(videoenhan)类目下的通用视频人脸融合MergeVideoFace的功能介绍以及代码示例。

1566 4
来自: 视觉生产  版块
|
机器学习/深度学习 TensorFlow 算法框架/工具
|

人脸识别概述-opencv中文文档

人脸识别概述-opencv中文文档

301 0
来自: 人脸人体  版块
|
机器学习/深度学习 编解码 算法
|

【OpenVI—通用检测系列之视频目标检测】(ICASSP 2023) 针对流感知的长短支路网络 LongShortNet

● 论文链接:https://arxiv.org/abs/2210.15518

12860 33
|
编解码 算法 程序员
|

MATLAB实现人脸识别

本篇博文基于MATLAB实现人脸识别,基于几何特征的算法,对人脸从图像采集、预处理、到特征点定位提取,校验通过;主要利用YCbCr肤色模型,通过连通分量提取算法定位人脸;对RGB图像通过形态学图像处理算法选定区域,再进行细化算法,找到其人脸坐标并提取出来;然后利用PCA与特征脸算法计算特征值完成识别。

533 0
来自: 人脸人体  版块
|
人工智能 算法 开发工具
|

【视觉智能AI场景解决方案——AI智慧运动】

  随着全民健身热潮的提升,智慧健身运动随着数字化新技术的进步,以及在运动健身领域的应用逐渐趋于成熟,智能运动健身将为传统运动健身提供更多新的方向和玩法,满足不同项目爱好者的健身需求。随着AI运动健身技术的进一步普及与应用,基于ai的智慧健身运动技术未来可打造的场景化空间会越来越多,体育运动与科技娱乐,智慧健身运动在线上体育行业未来会创新运动场景,丰富运动体验,提升竞技娱乐性,推动全民健身走向新的高度。

1755 3
|
存储 人工智能 算法
|

入门|图像增强技术

入门|图像增强技术

366 0
来自: 视觉生产  版块
|
机器学习/深度学习 存储 人工智能
|

【OpenVI-视觉评价系列之MOS评价实战篇】手机存储不够用,清理照片太痛苦?MOS评价帮你挑选“垃圾”照片

MOS(Mean Opinion Score)是一种常用的主观质量评价方法,常用于视频、图像等多媒体领域中的质量评价。MOS视觉评价通常是通过让受试者观看视频/图像,对视频的清晰度、锐度、颜色饱和度、运动模糊、噪声等方面进行评价。然而,MOS视觉评价也存在一些局限,例如需要大量的受试者,评估时间较长等。因此,近年来,研究者们也开始探索使用客观评价方法来替代或补充MOS视觉评价。

1112 2
|
机器学习/深度学习 数据采集 算法
|

【OpenVI—论文解读系列】ICLR 2023 | 开源轻量人脸检测DamoFD

本文介绍我们被机器学习顶级国际会议ICLR 2023接收的论文 “DamoFD: Digging into Backbone Design on Face Detection" 论文链接:https://openreview.net/pdf?id=NkJOhtNKX91 开源代码:https://github.com/ly19965/EasyFace/tree/master/face_project/face_detection/DamoFD

1430 2
来自: 人脸人体  版块
|
传感器 数据采集 人工智能
|

人体行为足力特征分析及其应用研究_kaic

随着社会现代化的发展和科技的不断进步,我国航天事业蓬勃发展,与此同时产生了很多亟待解决的难题,康复医疗成为航天医学和康复领域的重要课题之一。载人航天实践证明,失重对航天员生理功能有很大影响,这不仅涉及到航天员完成任务的安全性,同时会制约航天员返回地球后的再适应能力。这种因失重产生的生理问题与老年人的生理机能退化有相似之处,老年人摔倒是社会迫切需要面对的另一重大社会问题。老年人群体的跌倒发生率最高且后果严重,这不仅会导致高龄老年人安全感的严重缺失,还会大量消耗医疗服务资源。因此,开展助老防摔装备的研究是目前医疗和社会领域的必要发展方向,它有助于减少老年人跌倒所带来的生命危险.。

249 0
来自: 人脸人体  版块
|
机器学习/深度学习 编解码 自然语言处理
|

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(1)

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(1)

436 0
来自: 视觉生产  版块
|
机器学习/深度学习
|

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(2)

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(2)

354 0
来自: 视觉生产  版块
|
机器学习/深度学习 编解码
|

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(3)

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(3)

229 0
来自: 视觉生产  版块
|
数据可视化
|

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(4)

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(4)

296 0
来自: 视觉生产  版块
|
算法
|

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)

带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)

240 0
来自: 视觉生产  版块
|
机器学习/深度学习 编解码 缓存
|

【Pytorch】利用PyTorch实现图像识别

【Pytorch】利用PyTorch实现图像识别

1159 1
来自: 图像理解  版块
|
机器学习/深度学习 自动驾驶 机器人
|

使用机器学习改进图像分割

图像分割是许多计算机视觉应用的关键步骤,如对象识别和场景理解。本文介绍了一种使用机器学习方法改进图像分割的技术。我们提出了一种基于卷积神经网络的图像语义分割模型,该模型能够对图像进行高精度的像素级别分割。

345 0

视觉智能

为开发者提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。适用于数字营销、互联网娱乐、安防、手机应用、泛金融身份认证等行业。

0
今日
12885
内容
3
活动
818
关注
你好!
登录掌握更多精彩内容

相关产品

  • 视觉智能开放平台