|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义妙谈 -图像模型玩转更多可能!通义万相新升级 一个包罗万象的“应用广场”!

“买家秀”秒变“卖家秀”,AI一键更换商品模特,虚拟模特功能等你解锁🔒 “小草图”秒变“大制作”,AI涂鸦作画让你的草图“一秒”成画🖌️ “2-4图”生成“个人写真”,AI虚拟分身在线创作,在家也是巴厘岛🏖️ 阿里云的微博视频 全网征集灵魂画手,几笔生成精美大作,精美礼物等你来拿

946 3
来自: 通义万相  版块
|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义万相—涂鸦作画功能上线~欢迎体验

通义万相应用广场中新增功能:涂鸦作画~用户可试试在画板上涂鸦并结合描述生成画作,快来体验吧~

13824 10
来自: 通义万相  版块
|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义万相—写真馆功能上线,欢迎体验~

通义万相应用广场中新增功能:写真馆~用户上传2-4张真人照片,即可获得专属写真大片,快来体验吧~

1647 5
来自: 通义万相  版块
|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义万相—虚拟模特功能上线,欢迎体验~

通义万相应用广场中新增功能:虚拟模特~用户可上传真人实拍商品展示图,获取模特大片。快来体验吧~

11062 8
来自: 通义万相  版块
置顶
通义万相

通义妙谈-阿里云图像生成大模型通义万相,Composer算法实现绘图精准可控

通义妙谈-阿里云图像生成大模型通义万相,Composer算法实现绘图精准可控

13438 68
来自: 通义万相  版块
|
物联网 开发者 异构计算
|
置顶

facechain人物写真生成工业级开源

facechain人物写真应用自8月11日开源了第一版证件照生成后。目前在github(GitHub - modelscope/facechain: FaceChain is a deep-learning toolchain for generating your Digital-Twin.)上已有5.7K的star,论文链接:FaceChain: A Playground for Identity-Preserving Portrait Generation:https://arxiv.org/abs/2308.14256。

825 4
|
人工智能 编解码 算法
|
置顶

【IJCAI 2023】流感知优化之 DAMO-StreamNet 论文解读

传统视频目标检测(Video Object Detection, VOD)是离线(offline)的检测任务,即仅考虑算法的检测精度,未考虑算法的延时。流感知(Streaming Perception)任务作为VOD的一个细分方向,采用流平均精度(Streaming Average Precision, sAP)指标,衡量算法的在线(online)检测能力,即同时衡量算法的精度和延时。本文针对现有的流感知工作在训练方式和模型感受野两方面的不足,提出了DAMO-StreamNet,在保证算法实时性的前提下,实现了SOTA的性能。

1005 4
|
机器学习/深度学习 人工智能 自然语言处理
|
置顶

ChatGPT最强专业学习资料集锦

本文旨在整理一份可供参考和学习的专业ChatGPT相关资料,包括ChatGPT相关论文、Github项目、以及当前市场上出现的ChatGPT相关产品等。

1088 3
|
机器学习/深度学习 搜索推荐 计算机视觉
|
置顶

【阿里云OpenVI-人脸感知理解系列之人脸识别】基于Transformer的人脸识别新框架TransFace ICCV-2023论文深入解读

本文介绍 阿里云开放视觉智能团队 被计算机视觉顶级国际会议ICCV 2023接收的论文 "TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Perspective"。TransFace旨在探索ViT在人脸识别任务上表现不佳的原因,并从data-centric的角度去提升ViT在人脸识别任务上的性能。

2294 341
来自: 人脸人体  版块
|
机器学习/深度学习 编解码 算法
|
置顶

【阿里云OpenVI-视觉生产系列之图片上色】照片真实感上色算法DDColor ICCV2023论文深入解读

图像上色是老照片修复的一个关键步骤,本文介绍发表在 ICCV 2023 上的最新上色论文 DDColor

2885 10
来自: 视觉生产  版块
|
AI芯片
|
置顶

AIGC视频生成/编辑技术调研报告

随着图像生成领域的研究飞速发展,基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天,视频生成/编辑技术也引起了学术界和产业界的高度关注。该分享主要介绍视频生成/编辑的研究现状,包括不同技术路线的优劣势,以及该领域当下面临的核心问题与挑战。

1611 2
来自: 视觉生产  版块
|
机器学习/深度学习 人工智能 达摩院
|
置顶

AIGC玩转卡通化技术实践

伴随着持续不断的AIGC浪潮,越来越多的AI生成玩法正在被广大爱好者定义和提出,图像卡通化(动漫化)基于其还原效果高,风格种类丰富等特点而备受青睐。早在几年前,伴随着GAN网络的兴起,卡通化就曾经风靡一时。而今,伴随着AIGC技术的兴起和不断发展,扩散生成模型为卡通化风格和提供了更多的创意和生成的可能性。本文就将详细介绍达摩院开放视觉团队的卡通化技术实践。

57029 4
来自: 视觉生产  版块
|
机器学习/深度学习 编解码 人工智能
|
置顶

被低估且误解的换脸技术: 揭秘换脸技术本身的领域及行业价值

本文主要用尽量简单白话的描述来剖析下AI换脸技术的原理,做一个科普文章,了解下当前换脸技术的发展现状及其局限性。

1127 2
来自: 人脸人体  版块
|
编解码 人工智能 移动开发
|
置顶

AIGC图像分辨率太低?快来试试像素感知扩散超分模型,你想要的细节都在这里

阿里巴巴最新自研的像素感知扩散超分模型已经开源,它把扩散模型强大的生成能力和像素级控制能力相结合,能够适应从老照片修复到AIGC图像超分的各种图像增强任务和各种图像风格,并且能够控制生成强度和增强风格。这项技术的直接应用之一是AIGC图像的后处理增强和二次生成,能够带来可观的效果提升。

936 4
|
自然语言处理 测试技术 计算机视觉
|
置顶

OpenVI-感知理解系列之GAP骨骼点动作识别 ICCV23顶会论文深入解读

本文介绍了ICCV23中稿论文 GAP: Generative Action Description Prompts for Skeleton-based Action Recognition

1074 2
来自: 图像理解  版块
|
机器学习/深度学习 人工智能 达摩院
|
置顶

港大阿里“视觉AI任意门”,一键向场景中无缝传送物体

本文主要展示了阿里和港大的AI版「任意门」,实现零样本的图像嵌入。

1214 3
|
人工智能 自动驾驶 算法
|
置顶

本地生活技术雷达——生成式AI(Generative AI)在阿里本地生活的应用与思考

本地生活技术雷达是由本地生活技术中心战略管理&PMO团队开展的,定期扫描和评估新兴技术的战略研究工作。目的是对技术趋势进行前瞻性预判,提出新技术布局建议,在技术驱动业务创新和业务增长、践行社会责任等方面有一些实质性探索。 本篇尝试探讨 1)理解AI范式——从分析型(Analytical AI)到生成式(Generative AI)的拐点在2022年,其对人类社会以及商业模式的长期影响; 2)生成式AI(文生文、文生图、图生图等)在本地业务目前场景的应用和未来的方向。 欢迎技术、产品、运营、战略、管理层、国内国际等各种视角的指点和碰撞!

39545 8
|
17天前
|
Cloud Native 云栖大会 调度
|

平行云荣膺"阿里云产品生态伙伴合作攻坚奖""2022云栖科技创新奖"

2022云栖大会在杭州成功举办,平行云作为阿里云重要合作伙伴受邀参会,并凭借“元域电音Club”精彩亮相。会上,平行云荣获“阿里云产品生态伙伴合作攻坚奖”和“2022云栖科技创新奖”两项大奖,彰显其在云化XR领域的卓越贡献与创新实力。平行云为阿里云XR平台提供算力调度、3D实时渲染等服务,助力元宇宙产业云化转型,推动多行业创新业务形态发展。

66 15
|
19天前
|
数据可视化 JavaScript 前端开发
|

代码可视化平台

这是一个代码可视化工具,旨在简化代码理解过程。用户无需额外配置,直接复制代码即可实时观看执行过程,支持前进后退和动画展示。目前支持JavaScript和Python,未来将扩展更多语言。工具提供了数组、链表、栈、队列、二叉树和哈希表的可视化,并包含辅助函数和自定义注释功能。主要局限在于仅支持单段代码,且执行步数限制为500步。[了解更多](https://staying.fun/zh)

85 20
|
26天前
|
编解码 文字识别 自然语言处理
|

如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误

### 简介 【批量识别图片内容重命名】工具可批量识别图片中的文字并重命名文件,方便高效处理大量图片。然而,OCR 技术面临字符识别错误(如形近字混淆、生僻字识别不佳)、格式错误(段落错乱、换行问题)和语义理解错误等挑战。为提高准确性,建议提升图片质量、选择合适的 OCR 软件及参数,并结合自动校对与人工审核,确保最终文本的正确性和完整性。

100 12
来自: 图像理解  版块
|
2月前
|
JavaScript
|

vue使用iconfont图标

vue使用iconfont图标

134 1
|
2月前
|
文字识别 数据可视化 Serverless
|

阿里云多模态数据信息提取解决方案评测报告

本文基于阿里云多模态数据信息提取解决方案,对其进行全面评测。该方案利用百炼大模型等技术,支持文本、图像、音频和视频处理,显著提升效率并降低成本。体验中,文本和图片信息提取功能表现出色,部署便捷且准确率高。优势包括易用性、多模态支持和高性价比,但文档完善性和模型定制性等方面仍有提升空间。建议增强模型可定制性、跨模态融合能力及丰富文档案例,以进一步优化用户体验。

103 6
来自: 文字识别  版块
|
2月前
|
人工智能 自然语言处理 运维
|

阿里云多模态数据信息提取技术解决方案评测

阿里云多模态数据信息提取技术解决方案,利用先进AI技术处理文本、图像、音频和视频,帮助企业从海量数据中高效提取有价值信息。方案涵盖文本、图片、视频信息提取,适用于电商平台、安防等领域。通过大模型支持自动扩展与持续训练,提供简单部署及免费试用,评测显示其在识别准确性和易用性方面表现出色,但仍需优化高级设置提示和加载速度。

53 2
|
2月前
|
文字识别
|

ocr身份证识别调用

40 0
|
2月前
|
人工智能 小程序 API
|

【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态?

【云智AI运动识别小程序插件】提供人体、运动、姿态检测的AI能力,支持本地原生识别,无需后台服务,具有速度快、体验好、易集成等优点。本文介绍如何使用该插件实现用户上传视频的运动识别,包括视频解码抽帧和人体识别的实现方法。

106 10
来自: 人脸人体  版块
|
2月前
|
人工智能 小程序 数据处理
|

uni-app开发AI康复锻炼小程序,帮助肢体受伤患者康复!

近期,多家康复机构咨询AI运动识别插件是否适用于肢力运动受限患者的康复锻炼。本文介绍该插件在康复锻炼中的应用场景,包括康复运动指导、运动记录、恢复程度记录及过程监测。插件集成了人体检测、姿态识别等功能,支持微信小程序平台,使用便捷,安全可靠,帮助康复治疗更加高效精准。

98 1
来自: 人脸人体  版块
|
2月前
|
人工智能 小程序 UED
|

【一步步开发AI运动小程序】十六、AI运动识别中,如何判断人体站位?

【云智AI运动识别小程序插件】提供人体、运动及姿态检测的AI能力,本地引擎无需后台支持,具备快速、体验好、易集成等优势。本文介绍如何利用插件的`camera-view`功能,通过检测人体站位视角(前、后、左、右),确保运动时的最佳识别率和用户体验。代码示例展示了如何实现视角检查,确保用户正或背对摄像头,为后续运动检测打下基础。

104 16
来自: 人脸人体  版块
|
2月前
|
人工智能 小程序
|

【一步步开发AI运动小程序】十五、AI运动识别中,如何判断人体站位的远近?

【云智AI运动识别小程序插件】提供人体、运动及姿态检测的AI能力,无需后台支持,具有快速、体验好、易集成等特点。本文介绍如何利用插件判断人体与摄像头的远近,确保人体图像在帧内的比例适中,以优化识别效果。通过`whole`检测规则,分别实现人体过近和过远的判断,并给出相应示例代码。

148 67
|
2月前
|
人工智能 小程序 JavaScript
|

【一步步开发AI运动小程序】十四、主包超出2M大小限制,如何将插件分包发布?

本文介绍了如何从零开始开发一个AI运动小程序,重点讲解了通过分包技术解决程序包超过2M限制的问题。详细步骤包括在uni-app中创建分包、配置`manifest.json`和`pages.json`文件,并提供了分包前后代码大小对比,帮助开发者高效实现AI运动功能。

57 1
|
2月前
|
人工智能 小程序 API
|

【一步步开发AI运动小程序】十三、自定义一个运动分析器,实现计时计数02

本文介绍如何利用“云智AI运动识别小程序插件”开发AI运动小程序,详细解析了俯卧撑动作的检测规则构建与执行流程,涵盖卧撑和撑卧两个姿态的识别规则,以及如何通过继承`sports.SportBase`类实现运动分析器,适用于小程序开发者。

74 16
|
2月前
|
人工智能 小程序 API
|

【一步步开发AI运动小程序】十二、自定义一个运动分析器,实现计时计数01

随着AI技术的发展,AI运动APP如雨后春笋般涌现,如“乐动力”、“天天跳绳”等,推动了云上运动会、线上健身等热潮。本文将指导你从零开始开发一个AI运动小程序,利用“云智AI运动识别小程序插件”,介绍运动识别原理、计量方式及运动分析器基类的使用,帮助你在小程序中实现运动计时和计数功能。下篇将继续探讨运动姿态检测规则的编写。

97 16
|
2月前
|
人工智能 小程序 开发者
|

【一步步开发AI运动小程序】十一、人体关键点跳跃追踪

本文介绍如何利用“云智AI运动识别小程序插件”开发AI运动小程序,涵盖云上运动会、健身打卡等热门应用场景。通过示例代码展示如何调用插件功能,实现动作追踪与分析,助力开发者快速上手。

51 4
|
2月前
|
数据采集 人工智能 小程序
|

【一步步开发AI运动小程序】十、姿态动作相似度比较

本文介绍如何利用“云智AI运动识别小程序插件”开发AI运动小程序,重点讲解姿态动作相似度比较功能的运用,包括样本动作帧的采集和姿态相似度的计算方法,以及在组合运动中的应用实例。

86 11
|
2月前
|
编解码 人工智能 文字识别
|

用PDF转换图片的方式弥补通义千问在扫描版PDF支持方面的缺失

当前通义千问Web版和本地版qwen-VL在处理扫描版PDF时均无法直接识别,导致实际应用中处理大量扫描PDF的需求难以满足。为此,通过使用Python的pdf2image库,可将PDF文件转换为图片,再进行OCR处理,实现解决方案。文中提供了具体的代码示例,展示了如何将PDF文件的每一页转换成图片,并保存至指定文件夹,为后续的OCR处理做好准备。

96 3
|
2月前
|
开发框架 Go 计算机视觉
|

纯Go语言开发人脸检测、瞳孔/眼睛定位与面部特征检测插件-助力GoFly快速开发框架

开发纯go插件的原因是因为目前 Go 生态系统中几乎所有现有的人脸检测解决方案都是纯粹绑定到一些 C/C++ 库,如 OpenCV 或 dlib,但通过 cgo 调用 C 程序会引入巨大的延迟,并在性能方面产生显著的权衡。此外,在许多情况下,在各种平台上安装 OpenCV 是很麻烦的。使用纯Go开发的插件不仅在开发时方便,在项目部署和项目维护也能省很多时间精力。

66 5
来自: 人脸人体  版块
|
3月前
|
人工智能 小程序 IDE
|

【一步步开发AI运动小程序】九、姿态辅助调试桌面工具的使用

随着AI技术的发展,各大厂商推出的AI运动APP如“乐动力”、“天天跳绳”等,使云上运动会、线上健身等概念大热。本文将指导你如何利用“云智AI运动识别小程序插件”,在微信小程序中实现类似功能,包括工具搭建、服务启动及数据回传等步骤,助力开发者高效开发AI运动小程序。

79 1
|
3月前
|
JavaScript 前端开发 数据处理
|

函数柯里化有哪些优势

函数柯里化可以提高代码的复用性,使函数更灵活、更易于测试和维护。它通过将多参数函数转换为一系列单参数函数,简化了函数调用,支持部分应用,增强了函数的组合能力。

57 7
|
3月前
|
人工智能 小程序 搜索推荐
|

uni app下开发AI运动小程序解决方案

本文介绍了在小程序中实现AI运动识别的解决方案。该方案依托于UNI平台,通过高效便捷的插件形式,实现包括相机抽帧控制、人体识别、姿态识别等在内的多项功能,无需依赖后台服务器,大幅提高识别效率和用户体验。方案内置多种运动模式,支持自定义扩展,适用于AI健身、云上赛事、AI体测等多场景,适合新开发和存量改造项目。

83 3
|
3月前
|
人工智能 JSON 小程序
|

【一步步开发AI运动小程序】八、利用body-calc进行姿态识别

随着AI技术的发展,各大厂商推出的如“乐动力”、“天天跳绳”等AI运动APP,使得云上运动会、线上健身等概念风靡一时。本文将引导读者从零开始开发一个AI运动小程序,使用“云智AI运动识别小程序插件”,介绍人体姿态检测规则、规则编写语法、执行检测规则运算及姿态检测实战等内容,助力开发者轻松实现AI运动小程序的开发。

73 3
|
3月前
|
存储 编译器 数据处理
|

C 语言结构体与位域:高效数据组织与内存优化

C语言中的结构体与位域是实现高效数据组织和内存优化的重要工具。结构体允许将不同类型的数据组合成一个整体,而位域则进一步允许对结构体成员的位进行精细控制,以节省内存空间。两者结合使用,可在嵌入式系统等资源受限环境中发挥巨大作用。

96 11
|
3月前
|
人工智能 小程序 前端开发
|

【一步步开发AI运动小程序】六、人体骨骼图绘制

随着AI技术的发展,阿里体育等公司推出的AI运动APP如“乐动力”、“天天跳绳”等,使云上运动会、线上健身等概念广受欢迎。本文将引导您从零开始,利用“云智AI运动识别小程序插件”,在小程序中实现类似功能,包括人体骨骼图的绘制原理及其实现代码,确保骨骼图与人体图像精准重合。下篇将继续介绍运动分析方法。

80 2
来自: 人脸人体  版块
|
3月前
|
人工智能 小程序
|

【一步步开发AI运动小程序】七、进行运动计时、计数

随着AI技术的发展,阿里体育推出的“乐动力”、“天天跳绳”等APP,使云上运动会、AI体育指导等概念备受关注。本文将引导您从零开始,利用“云智AI运动识别小程序插件”,在小程序中实现类似功能。通过插件的`sports`和`calc`命名空间,可轻松实现运动检测、计时计数等功能。示例代码展示了如何创建并使用俯卧撑运动分析器,以及如何通过摄像头捕获图像进行人体识别和运动分析。敬请期待后续关于姿态分析的内容。

74 0
来自: 人脸人体  版块
|
3月前
|
Java
|

在 Java 中,如何自定义`NumberFormatException`异常

在Java中,自定义`NumberFormatException`异常可以通过继承`IllegalArgumentException`类并重写其构造方法来实现。自定义异常类可以添加额外的错误信息或行为,以便更精确地处理特定的数字格式转换错误。

58 1
|
3月前
|
数据采集 并行计算 算法
|

函数式编程

函数式编程是一种编程范式,它将计算视为数学函数的求值,并避免改变状态和可变数据。其核心思想是使用纯函数,减少副作用,提高代码的可读性和并行处理能力。

83 7
|
3月前
|
安全 Java 测试技术
|

如何创建一个信任所有证书的`TrustManager`

`TrustManager`是Java中用于管理SSL/TLS信任关系的接口,主要用于验证服务器证书。本文介绍了如何创建一个信任所有证书的`TrustManager`,并通过示例代码展示了具体的实现步骤。虽然这种方法在测试环境中很有用,但在生产环境中使用时存在严重的安全风险。

280 3
|
3月前
|
安全 测试技术 API
|

在实际应用中,如何判断是否需要创建信任所有证书的 TrustManager

在实际应用中,判断是否需要创建信任所有证书的TrustManager时,需考虑安全性与便捷性的平衡。通常,开发和测试环境可使用信任所有证书的TrustManager,但生产环境应严格验证证书,确保通信安全。

114 56

视觉智能

为开发者提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。适用于数字营销、互联网娱乐、安防、手机应用、泛金融身份认证等行业。

0
今日
12886
内容
3
活动
719
关注
你好!
登录掌握更多精彩内容

相关产品

  • 视觉智能开放平台