视觉智能-官方博客-第19页-阿里云开发者社区

阿里云OpenVI

|

机器学习/深度学习人工智能算法

|

博文

【OpenVI—AI热点日报】8月25日

AI热点日报隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

440 0 0

阿里云OpenVI

|

人工智能搜索推荐安全

|

博文

【OpenVI—AI热点日报】8月24日

AI热点日报隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

403 0 0

阿里云OpenVI

|

人工智能自然语言处理机器人

|

博文

【OpenVI—AI热点日报】8月23日

AI热点日报隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

568 0 0

阿里云OpenVI

|

机器学习/深度学习人工智能自然语言处理

|

博文

【OpenVI—AI热点日报】8月22日

📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报～

546 1 1

小小开发楠楠子

|

数据可视化数据处理计算机视觉

|

博文

Grounded-SAM模型：自动化检测、分割、生成一切

借着Meta发布的Segment Anything视觉大模型，作者团队做了一个最强Zero-Shot视觉应用：最强的Zero-Shot检测器，最强的Zero-Shot分割器，最强的Zero-Shot生成器，三合一模型简称为Grounded-SAM。

4449 4 5

阿里云OpenVI

|

人工智能算法搜索推荐

|

博文

FaceChain：1周3K star，3张照片打造专属形象！人人AIGC!

FaceChain团队推出了开源人物写真项目，希望结合开源社区开发者的力量，可以让图片应用更有趣、更好玩、也有更多应用场景。

26699 11 16

阿里云OpenVI

|

机器学习/深度学习 Web App开发人工智能

|

博文

【OpenVI—AI热点日报】8月21日

AI热点日报八月第13期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

492 1 1

阿里云OpenVI

|

机器学习/深度学习人工智能安全

|

博文

【OpenVI—AI热点日报】8月18日

AI热点日报八月第12期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

399 0 0

阿里云OpenVI

|

存储人工智能达摩院

|

博文

【OpenVI—AI热点日报】8月17日

AI热点日报八月第12期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

473 0 0

游客cjpicedaelydo

|

机器学习/深度学习人工智能达摩院

|

博文

！！抠图分割-在线自动抠图-快速抠图-0元免费调用33333次！！

视觉智能开放平台发福利啦~~大家快来跟我一起薅羊毛！！！

1077 3 3

来自：分割抠图版块

阿里云OpenVI

|

人工智能达摩院自然语言处理

|

博文

【OpenVI—AI热点日报】8月16日

AI热点日报八月第11期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

494 1 1

阿里云OpenVI

|

人工智能安全 JavaScript

|

博文

【OpenVI—AI热点日报】8月15日

AI热点日报八月第10期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

426 1 1

y22d5jdczpqg6

|

机器学习/深度学习数据采集人工智能

|

博文

过去几年里，表征模型在自然语言处理、计算机视觉、语音处理等领域取得了巨大的成功。经过大量数据学习的表征模型，不仅可以在各种下游任务上取得良好的效果，还可以作为大规模语言模型（LLM）的基座模型，为LLM提供多模态理解能力。随着多模态技术的发展，尤其CLIP[1]之后大家都意识到一个好的多模态表征模型在很多单模态任务上都会发挥着至关重要的基础模型的作用。学习了大量模态alignment的数据之后的模型逐渐在学会去理解各个模态和模态间蕴含的知识，甚至通过对大量模态的学习促进对其它模态的理解。

22835 7 7

阿里云OpenVI

|

机器学习/深度学习人工智能达摩院

|

博文

【OpenVI—AI热点日报】8月14日

AI热点日报八月第9期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

442 3 3

阿里云OpenVI

|

传感器机器学习/深度学习人工智能

|

博文

【OpenVI—AI热点日报】8月11日

AI热点日报八月第8期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

436 0 0

音视频牛哥

|

编解码缓存 Linux

|

博文

对话音视频牛哥：如何设计功能齐全的跨平台低延迟RTMP播放器

423 0 0

音视频牛哥

|

编解码缓存监控

|

博文

GB28181设备接入侧如何支持H.265？

527 0 0

音视频牛哥

|

数据采集监控前端开发

|

博文

GB28181设备接入端如何播放语音广播数据？

384 0 0

音视频牛哥

|

编解码开发工具 Android开发

|

博文

Android平台如何实现第三方模块编码后(H.264/H.265/AAC/PCMA/PCMU)数据实时预览播放

321 0 0

阿里云OpenVI

|

人工智能自然语言处理达摩院

|

博文

【OpenVI—AI热点日报】8月10日

AI热点日报八月第7期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

456 0 0

阿里云OpenVI

|

机器学习/深度学习人工智能自然语言处理

|

博文

【OpenVI—AI热点日报】8月9日

AI热点日报八月第6期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

390 0 0

阿里云OpenVI

|

机器学习/深度学习敏捷开发人工智能

|

博文

【OpenVI—AI热点日报】8月8日

AI热点日报八月第6期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

382 0 0

阿里云OpenVI

|

人工智能自然语言处理达摩院

|

博文

【OpenVI—AI热点日报】8月7号

AI热点日报八月第5期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

585 2 2

阿里云OpenVI

|

机器学习/深度学习 Web App开发人工智能

|

博文

【OpenVI—AI热点日报】8月4日

AI热点日报八月第4期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

432 2 2

阿里云OpenVI

|

人工智能自然语言处理算法

|

博文

【OpenVI—AI热点日报】8月3日

AI热点日报八月第三期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

325 2 2

开发者说

|

文字识别

|

博文

视觉智能开放平台官方征稿活动7月获奖名单

591 2 2

阿里云OpenVI

|

机器学习/深度学习人工智能自然语言处理

|

博文

【OpenVI—AI热点日报】8月2日

AI热点日报八月第二期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

397 1 1

阿里云OpenVI

|

机器学习/深度学习 Web App开发人工智能

|

博文

【OpenVI—AI热点日报】8月1日

AI热点日报八月第一期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

533 2 2

夏夜许游

|

人工智能城市大脑 API

|

博文

基于阿里云视觉智能开放平台的动漫化视频产出方案

阿里云视觉智能开放平台的现有API能力，做出一个批量化生成动漫化视频的方案。

1337 2 3

阿里云OpenVI

|

机器学习/深度学习人工智能自然语言处理

|

博文

【OpenVI—AI热点日报】7月31日

AI热点日报第三期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。

355 2 2

yma16

|

开发工具计算机视觉文字识别

|

博文

接入阿里视觉智能平台免费体验—人脸人体识别ocr与二次元风格转化使用

22083 4 8

来自：人脸人体版块

阿里云OpenVI

|

人工智能缓存达摩院

|

博文

【OpenVI—AI热点日报】7月28日

AI热点日报第二期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。

323 4 4

不起名字可以不

|

机器学习/深度学习存储人工智能

|

博文

AI入门必修，9分钟搭建文生图应用

《动手吧，开发者》由阿里云存储专家“征越”带来AI绘画平台Stable Diffusion的部署方式，领取文件存储NAS+模型在线服务PAI-EAS试用资源即可动实操！

803 2 2

三掌柜666

|

人工智能自然语言处理安全

|

博文

在AIGC浪潮之下，人脸生成、保ID方向的应用和发展方向

随着人工智能技术的不断发展和应用，人脸生成和身份保护方向成为了人工智能技术发展的重要方向之一。在这个领域，阿里云的智能开放平台提供了强大的技术支持和应用场景，为人脸生成和身份保护的应用和发展提供了新的可能性。接下来将结合阿里云的智能开放平台来谈AIGC浪潮下人脸生成、保ID方向的应用和发展方向。

760 1 1

阿里云OpenVI

|

机器学习/深度学习人工智能达摩院

|

博文

【OpenVI—AI热点日报】7月26日

AI热点日报第一期隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。

455 5 5

三掌柜666

|

机器学习/深度学习人工智能自然语言处理

|

博文

借助AIGC实现人物写真和服装试穿

大家都知道，最近两名人工智能技术的高速发展，让越来越多的企业开始关注如何将人工智能技术应用到自己的业务中。阿里云作为业内领先的云计算服务提供商，其智能开放平台在人工智能领域的技术积累和应用能力方面处于领先地位。接下来将结合阿里云的视觉智能开放平台来聊一下借助AIGC实现人物写真和服装试穿等功能。

865 1 2

六月的雨在钉钉

|

人工智能 Serverless 开发者

|

博文

AIGC-无限创作

讲述基于函数计算的AIGC部署及ChatGPT部署

870 1 2

来自：视觉生产版块

江上清风山间明月

|

编解码人工智能 PyTorch

|

博文

Stable Diffusion如何生成高质量的图-prompt写法介绍

2260 2 2

小小开发楠楠子

|

人工智能 API C++

|

博文

【AI绘画大比拼】通义万相VS文心一格：探索十种风格下的绘画生成差异！

近日，通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中，通义万相的强大的“文生图”功能，不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。那么，在类似的Prompt下，两款产品的表现将会如何呢？今天就让我们就十种风格下二者生成图像的表现力，来看看这两款产品的差异。

6435 8 8

来自：通义万相版块

阿里云OpenVI

|

vr&ar 计算机视觉

|

博文

REALY头部重建榜单冠军模型HRN解读【OpenVI—论文解读系列】

高保真 3D 头部重建在许多场景中都有广泛的应用，例如 AR/VR、医疗、电影制作等。尽管大量的工作已经使用 LightStage 等专业硬件实现了出色的重建效果，从单一或稀疏视角的单目图像估计高精细的面部模型仍然是一个具有挑战性的任务。本文中，我们将介绍CVPR2023最新的头部重建论文，该工作在单图头部重建榜单REALY上取得正脸、侧脸双榜第一，并在其他多个数据集中取得了SOTA的效果。

1098 6 7

来自：人脸人体版块

阿里云OpenVI

|

人工智能监控算法

|

博文

【视觉智能AI场景解决方案——智慧物流车牌识别】

随着AI技术的问世，物流行业迎来了速度、准确率、系统化的全方位提升。通过使用AI识别车牌与车辆功能，物流企业可以实现对车辆的快速、准确的识别，提高物流车辆的管理效率。此外，AI还可以帮助物流企业实现对车辆功能的识别，如车辆类型、载重等，为物流调度提供更加科学的指导。AI识别车牌与车辆功能的应用正日益普及，为智慧物流行业带来了新的发展机遇。

1160 0 0

来自：文字识别版块

anisbob

|

机器学习/深度学习图形学计算机视觉

|

博文

人脸前沿技术分享与探讨

283 0 0

不起名字可以不

|

机器学习/深度学习人工智能监控

|

博文

人脸前沿技术分享与探讨

随着人工智能的迅速发展，人脸识别技术作为其重要应用之一，正引领着数字时代的潮流。在这个信息爆炸的时代，人脸前沿技术的分享与探讨，成为了科技界和各个行业关注的焦点。本文将以人脸前沿技术为主题，分享人脸识别技术的最新发展，并探讨其在智慧办公、安防、数字营销、互联网娱乐等领域的广泛应用，以及面临的挑战和未来的发展方向。

463 0 0

Crossin的编程教室

|

机器学习/深度学习人工智能自动驾驶

|

博文

OpenCV-Python，计算机视觉开发利器

人工智能，一个已经被谈论了几十年的概念（最早是图灵在1950年提出）。如今这几年，相关技术的发展速度是越来越快。高大上如无人驾驶、智能安防、AI辅助诊断，接地气如刷脸支付、内容推荐、自动翻译等，众多领域借助人工智能的力量而进化。从百度搜索指数的变化，也能从一个侧面反映出关注度在不断上升。

651 0 0

来自：视觉生产版块

Crossin的编程教室

|

机器学习/深度学习人工智能算法

|

博文

Python+OpenCV 十几行代码模仿世界名画

我最近才发现在 OpenCV 的 Sample 代码中就有图像风格迁移的 Python 示例（原谅我的后知后觉），是基于 ECCV 2016 论文中的网络模型实现。所以，即使作为人工智能的菜鸟，也可以拿别人训练好的模型来玩一玩，体会下神经网络的奇妙。

817 0 0

来自：视觉生产版块

小小开发楠楠子

|

人工智能搜索推荐

|

博文

‘通义万相’使用体验——令人惊艳的AI绘画创作大模型

7月7日，阿里云在2023世界人工智能大会上宣布，AI绘画创作大模型通义万相开启定向邀测。通义万相是阿里云“通义”大模型系列第三个产品，此前的通义千问、通义听悟分别具备文字问答和语音文字处理的功能。目前该模型已经开启定向邀测.

12663 9 9

来自：通义万相版块

开发者说

|

人工智能 API 开发者

|

博文

阿里云视觉智能开放平台官方征稿来啦！

参加阿里云视觉智能开放平台征稿，赢取定制好礼

11316 6 13

阿里云OpenVI

|

机器学习/深度学习算法自动驾驶

|

博文

【OpenVI-通用检测系列之图像实例分割】（CVPR 2023）快速实例分割框架FasInst

论文链接：https://arxiv.org/abs/2303.08594

1343 5 5

阿里云OpenVI

|

人工智能 vr&ar

|

博文

【视觉智能AI场景解决方案——AI视频互动娱乐】

如今我们正逐渐进入一个智能化时代，AI视频互动娱乐在娱乐场景中被广泛应用。它利用先进的人工智能技术和互动性强的视频娱乐形式，为用户带来全新的娱乐体验。无论是与虚拟角色互动竞技，还是参与丰富多样的虚拟现实体验，AI视频互动娱乐都能让用户沉浸其中。现如今我们可以在电子游戏、电影、电视节目等传统娱乐形式中见到视觉AI的影子。那么，AI和我们的生活娱乐中能撞出什么火花？来看看当下最火爆的视频互娱新玩法吧~

1561 3 3

来自：视觉生产版块

阿里云OpenVI

|

机器学习/深度学习存储编解码

|

博文

【OpenVI—论文解读系列】ICCV | 开源融合不确定度的自监督MVS框架

论文链接：Digging into Uncertainty inSelf-supervised Multi-view Stereo 多视图立体视觉作为计算机视觉领域的一项基本的任务，利用同一场景在不同视角下的多张图片来重构3D的信息。自监督多视角立体视觉(MVS)近年来取得了显著的进展。然而，以往的方法缺乏对自监督MVS中pretext任务提供的监督信号进行有效性的全面解释。本文首次提出在自监督MVS中估计认知不确定性(epistemic uncertainty)。

698 5 5

最新

通义万相

官方博客

问答

视频

【OpenVI—AI热点日报】8月25日

【OpenVI—AI热点日报】8月24日

【OpenVI—AI热点日报】8月23日

【OpenVI—AI热点日报】8月22日

Grounded-SAM模型：自动化检测、分割、生成一切

FaceChain：1周3K star，3张照片打造专属形象！人人AIGC!

【OpenVI—AI热点日报】8月21日

【OpenVI—AI热点日报】8月18日

【OpenVI—AI热点日报】8月17日

！！抠图分割-在线自动抠图-快速抠图-0元免费调用33333次！！

【OpenVI—AI热点日报】8月16日

【OpenVI—AI热点日报】8月15日

ONE-PEACE：探索通往无限模态的通用表征模型

【OpenVI—AI热点日报】8月14日

【OpenVI—AI热点日报】8月11日

对话音视频牛哥：如何设计功能齐全的跨平台低延迟RTMP播放器

GB28181设备接入侧如何支持H.265？

GB28181设备接入端如何播放语音广播数据？

Android平台如何实现第三方模块编码后(H.264/H.265/AAC/PCMA/PCMU)数据实时预览播放

【OpenVI—AI热点日报】8月10日

【OpenVI—AI热点日报】8月9日

【OpenVI—AI热点日报】8月8日

【OpenVI—AI热点日报】8月7号

【OpenVI—AI热点日报】8月4日

【OpenVI—AI热点日报】8月3日

视觉智能开放平台官方征稿活动7月获奖名单

【OpenVI—AI热点日报】8月2日

【OpenVI—AI热点日报】8月1日

基于阿里云视觉智能开放平台的动漫化视频产出方案

【OpenVI—AI热点日报】7月31日

接入阿里视觉智能平台免费体验—人脸人体识别ocr与二次元风格转化使用

【OpenVI—AI热点日报】7月28日

AI入门必修，9分钟搭建文生图应用

在AIGC浪潮之下，人脸生成、保ID方向的应用和发展方向

【OpenVI—AI热点日报】7月26日

借助AIGC实现人物写真和服装试穿

AIGC-无限创作

Stable Diffusion如何生成高质量的图-prompt写法介绍

【AI绘画大比拼】通义万相VS文心一格：探索十种风格下的绘画生成差异！

REALY头部重建榜单冠军模型HRN解读【OpenVI—论文解读系列】

【视觉智能AI场景解决方案——智慧物流车牌识别】

人脸前沿技术分享与探讨

人脸前沿技术分享与探讨

OpenCV-Python，计算机视觉开发利器

Python+OpenCV 十几行代码模仿世界名画

‘通义万相’使用体验——令人惊艳的AI绘画创作大模型

阿里云视觉智能开放平台官方征稿来啦！

【OpenVI-通用检测系列之图像实例分割】（CVPR 2023）快速实例分割框架FasInst

【视觉智能AI场景解决方案——AI视频互动娱乐】

【OpenVI—论文解读系列】ICCV | 开源融合不确定度的自监督MVS框架

视觉智能

活跃用户

相关产品