|
8月前
|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义妙谈 -图像模型玩转更多可能!通义万相新升级 一个包罗万象的“应用广场”!

“买家秀”秒变“卖家秀”,AI一键更换商品模特,虚拟模特功能等你解锁🔒 “小草图”秒变“大制作”,AI涂鸦作画让你的草图“一秒”成画🖌️ “2-4图”生成“个人写真”,AI虚拟分身在线创作,在家也是巴厘岛🏖️ 阿里云的微博视频 全网征集灵魂画手,几笔生成精美大作,精美礼物等你来拿

735 2
来自: 通义万相  版块
|
8月前
|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义万相—涂鸦作画功能上线~欢迎体验

通义万相应用广场中新增功能:涂鸦作画~用户可试试在画板上涂鸦并结合描述生成画作,快来体验吧~

13493 10
来自: 通义万相  版块
|
8月前
|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义万相—写真馆功能上线,欢迎体验~

通义万相应用广场中新增功能:写真馆~用户上传2-4张真人照片,即可获得专属写真大片,快来体验吧~

1053 5
来自: 通义万相  版块
|
8月前
|
人工智能 图形学 计算机视觉
|
置顶
通义万相

通义万相—虚拟模特功能上线,欢迎体验~

通义万相应用广场中新增功能:虚拟模特~用户可上传真人实拍商品展示图,获取模特大片。快来体验吧~

10718 7
来自: 通义万相  版块
|
9月前
|
置顶
通义万相

通义妙谈-阿里云图像生成大模型通义万相,Composer算法实现绘图精准可控

通义妙谈-阿里云图像生成大模型通义万相,Composer算法实现绘图精准可控

11574 8
来自: 通义万相  版块
|
9月前
|
物联网 开发者 异构计算
|
置顶

facechain人物写真生成工业级开源

facechain人物写真应用自8月11日开源了第一版证件照生成后。目前在github(GitHub - modelscope/facechain: FaceChain is a deep-learning toolchain for generating your Digital-Twin.)上已有5.7K的star,论文链接:FaceChain: A Playground for Identity-Preserving Portrait Generation:https://arxiv.org/abs/2308.14256。

637 4
|
11月前
|
人工智能 编解码 算法
|
置顶

【IJCAI 2023】流感知优化之 DAMO-StreamNet 论文解读

传统视频目标检测(Video Object Detection, VOD)是离线(offline)的检测任务,即仅考虑算法的检测精度,未考虑算法的延时。流感知(Streaming Perception)任务作为VOD的一个细分方向,采用流平均精度(Streaming Average Precision, sAP)指标,衡量算法的在线(online)检测能力,即同时衡量算法的精度和延时。本文针对现有的流感知工作在训练方式和模型感受野两方面的不足,提出了DAMO-StreamNet,在保证算法实时性的前提下,实现了SOTA的性能。

853 3
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|
置顶

ChatGPT最强专业学习资料集锦

本文旨在整理一份可供参考和学习的专业ChatGPT相关资料,包括ChatGPT相关论文、Github项目、以及当前市场上出现的ChatGPT相关产品等。

899 3
|
11月前
|
机器学习/深度学习 搜索推荐 计算机视觉
|
置顶

【阿里云OpenVI-人脸感知理解系列之人脸识别】基于Transformer的人脸识别新框架TransFace ICCV-2023论文深入解读

本文介绍 阿里云开放视觉智能团队 被计算机视觉顶级国际会议ICCV 2023接收的论文 "TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Perspective"。TransFace旨在探索ViT在人脸识别任务上表现不佳的原因,并从data-centric的角度去提升ViT在人脸识别任务上的性能。

1890 341
来自: 人脸人体  版块
|
11月前
|
机器学习/深度学习 编解码 算法
|
置顶

【阿里云OpenVI-视觉生产系列之图片上色】照片真实感上色算法DDColor ICCV2023论文深入解读

图像上色是老照片修复的一个关键步骤,本文介绍发表在 ICCV 2023 上的最新上色论文 DDColor

2315 10
来自: 视觉生产  版块
|
11月前
|
AI芯片
|
置顶

AIGC视频生成/编辑技术调研报告

随着图像生成领域的研究飞速发展,基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天,视频生成/编辑技术也引起了学术界和产业界的高度关注。该分享主要介绍视频生成/编辑的研究现状,包括不同技术路线的优劣势,以及该领域当下面临的核心问题与挑战。

1395 2
来自: 视觉生产  版块
|
10月前
|
机器学习/深度学习 人工智能 达摩院
|
置顶

AIGC玩转卡通化技术实践

伴随着持续不断的AIGC浪潮,越来越多的AI生成玩法正在被广大爱好者定义和提出,图像卡通化(动漫化)基于其还原效果高,风格种类丰富等特点而备受青睐。早在几年前,伴随着GAN网络的兴起,卡通化就曾经风靡一时。而今,伴随着AIGC技术的兴起和不断发展,扩散生成模型为卡通化风格和提供了更多的创意和生成的可能性。本文就将详细介绍达摩院开放视觉团队的卡通化技术实践。

56844 4
来自: 视觉生产  版块
|
10月前
|
机器学习/深度学习 编解码 人工智能
|
置顶

被低估且误解的换脸技术: 揭秘换脸技术本身的领域及行业价值

本文主要用尽量简单白话的描述来剖析下AI换脸技术的原理,做一个科普文章,了解下当前换脸技术的发展现状及其局限性。

735 2
来自: 人脸人体  版块
|
10月前
|
编解码 人工智能 移动开发
|
置顶

AIGC图像分辨率太低?快来试试像素感知扩散超分模型,你想要的细节都在这里

阿里巴巴最新自研的像素感知扩散超分模型已经开源,它把扩散模型强大的生成能力和像素级控制能力相结合,能够适应从老照片修复到AIGC图像超分的各种图像增强任务和各种图像风格,并且能够控制生成强度和增强风格。这项技术的直接应用之一是AIGC图像的后处理增强和二次生成,能够带来可观的效果提升。

728 4
|
10月前
|
自然语言处理 测试技术 计算机视觉
|
置顶

OpenVI-感知理解系列之GAP骨骼点动作识别 ICCV23顶会论文深入解读

本文介绍了ICCV23中稿论文 GAP: Generative Action Description Prompts for Skeleton-based Action Recognition

839 2
来自: 图像理解  版块
|
10月前
|
机器学习/深度学习 人工智能 达摩院
|
置顶

港大阿里“视觉AI任意门”,一键向场景中无缝传送物体

本文主要展示了阿里和港大的AI版「任意门」,实现零样本的图像嵌入。

1057 3
|
10月前
|
人工智能 自动驾驶 算法
|
置顶

本地生活技术雷达——生成式AI(Generative AI)在阿里本地生活的应用与思考

本地生活技术雷达是由本地生活技术中心战略管理&PMO团队开展的,定期扫描和评估新兴技术的战略研究工作。目的是对技术趋势进行前瞻性预判,提出新技术布局建议,在技术驱动业务创新和业务增长、践行社会责任等方面有一些实质性探索。 本篇尝试探讨 1)理解AI范式——从分析型(Analytical AI)到生成式(Generative AI)的拐点在2022年,其对人类社会以及商业模式的长期影响; 2)生成式AI(文生文、文生图、图生图等)在本地业务目前场景的应用和未来的方向。 欢迎技术、产品、运营、战略、管理层、国内国际等各种视角的指点和碰撞!

39368 8

视觉智能

为开发者提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。适用于数字营销、互联网娱乐、安防、手机应用、泛金融身份认证等行业。

0
今日
11725
内容
3
活动
590
关注
你好!
登录掌握更多精彩内容

相关产品

  • 视觉智能开放平台