视觉智能开放平台的搜索结果_热门_第8页-阿里云开发者社区

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型，参数量为26亿，基于扩散模型和Transformer架构，支持多种推理求解器，能生成高质量、多风格的图像。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 自然语言处理 # 算法框架/工具

三分钟热度的鱼

|

问答

|

来自：视觉智能

文字识别OCR支持图片分类吗？

# 文字识别 # 视觉智能开放平台 # 文字识别

真的很搞笑

|

问答

|

来自： ModelScope模型即服务

ModelScope有没有人知道windows安装ttsfrd的方法或者ttsfrd源码？

# 视觉智能开放平台 # Windows

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

每个人都可以成为虚拟主播，一键创建属于你的虚拟形象，RAIN 为你实时生成逼真动画角色

RAIN 是一款创新的实时动画生成工具，支持在消费级硬件上实现无限视频流的实时动画化，适用于直播、虚拟角色生成等场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 缓存 # PyTorch # 异构计算

温柔的养猫人

|

博文

|

来自：视觉智能

带你读《深度学习与图像识别：原理与实践》之三：图像分类之KNN算法

这是一部从技术原理、算法和工程实践3个维度系统讲解图像识别的著作，由阿里巴巴达摩院算法专家、阿里巴巴技术发展专家、阿里巴巴数据架构师联合撰写。在知识点的选择上，本书广度和深度兼顾，既能让完全没有基础的读者迅速入门，又能让有基础的读者深入掌握图像识别的核心技术；在写作方式上，本书避开了复杂的数学公式及其推导，从问题的前因后果、创造者的思考过程，利用简单的数学计算来做模型分析和讲解，通俗易懂。更重要的是，本书不仅仅是聚焦于技术，而是将重点放在了如何用技术解决实际的业务问题。

# 图像识别 # 视觉智能开放平台 # 算法 # Python # 机器学习/深度学习 # 数据采集 # 算法框架/工具

三分钟热度的鱼

|

问答

|

来自：视觉智能

OCR发票识别不到？

# 文字识别 # 视觉智能开放平台 # 文字识别

zhekr76ctyjts

|

博文

|

来自： ModelScope模型即服务

达摩院CVPR2023人脸重建论文HRN解读——REALY榜单冠军模型

前言高保真 3D 人脸重建在许多场景中都有广泛的应用，例如 AR/VR、医疗、电影制作等。尽管大量的工作已经使用 LightStage 等专业硬件实现了出色的重建效果，从单一或稀疏视角的单目图像估计高精细的面部模型仍然是一个具有挑战性的任务。本文中，我们将介绍来自达摩院的CVPR2023最新的人脸重建论文，该工作在单图人脸重建榜单REALY上取得正脸、侧脸双榜第一，并在其他多个数据集中取得了SO

# 视觉智能开放平台 # 达摩院 # vr&ar # 计算机视觉

AI小怪兽

|

博文

|

来自： ModelScope模型即服务

YOLOv10实战：红外小目标实战 | 多头检测器提升小目标检测精度

本文改进：在进行目标检测时，小目标会出现漏检或检测效果不佳等问题。YOLOv10有3个检测头，能够多尺度对目标进行检测，但对微小目标检测可能存在检测能力不佳的现象，因此添加一个微小物体的检测头，能够大量涨点，map提升明显；多头检测器提升小目标检测精度，1）mAP50从0.666提升至0.677

# 视觉智能开放平台 # 机器学习/深度学习 # 计算机视觉

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Umi-OCR：31K Star！离线OCR终结者！公式+二维码+多语种，开源免费吊打付费

Umi-OCR 是一款免费开源的离线 OCR 文字识别工具，支持截图、批量图片、PDF 扫描件的文字识别，内置多语言识别库，提供命令行和 HTTP 接口调用功能。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 自然语言处理 # 算法

嘟嘟嘟嘟嘟嘟

|

问答

|

来自：视觉智能

视觉智能平台证件照换装应该用什么技术呢？

# 视觉智能开放平台

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台