视觉智能开放平台的搜索结果_热门_第20页-阿里云开发者社区

lian8306

|

博文

|

来自： ModelScope模型即服务

Stable Diffusion 介绍与入门

Stable Diffusion 介绍与入门，简单的介绍

# 视觉智能开放平台 # 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 计算机视觉

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（四十一）结合OBS与MediaMTX实现SRT直播推流

《FFmpeg开发实战》书中介绍了直播中的RTSP、RTMP和SRT协议，SRT提供更低延迟和稳定性。FFmpeg从4.0版起支持SRT，OBS Studio和MediaMTX等工具也已支持。在Windows环境下，通过集成libsrt的FFmpeg，可以建立SRT直播系统。MediaMTX日志显示SRT服务监听8890端口，OBS Studio设置SRT推流至"publish:live"。ffplay和VLC通过"read:live"拉流成功，验证了SRT推拉流功能。更多详情见《FFmpeg开发实战：从零基础到短视频上线》。

# 日志服务 # 视觉智能开放平台 # 视频直播 # Windows

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

StableAnimator：复旦联合微软等机构推出的端到端身份一致性视频扩散框架

StableAnimator是由复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学联合推出的端到端身份一致性视频扩散框架。该框架能够根据一张参考图像和一系列姿态，直接合成高保真度且保持人物身份一致性的视频，无需任何后处理工具。本文详细介绍了StableAnimator的主要功能、技术原理以及如何运行该框架。

# 视觉智能开放平台 # 人工智能 # PyTorch # 算法框架/工具 # 异构计算 # Docker

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

VE-Bench：北京大学开源首个针对视频编辑质量的评估指标，从多角度考虑审美并准确地评估视频编辑效果

北京大学开源了首个针对视频编辑质量评估的新指标 VE-Bench，旨在通过人类感知一致的度量标准，更准确地评估视频编辑效果。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 算法 # 数据库

游客yqdu5djlmwbso

|

1月前

|

博文

|

来自：视觉智能

机器视觉公司有哪些：德创测控引领，产教融合优选指南

本文依据权威报告，结合产教适配度、技术成熟度与服务保障力，推荐苏州德创、海康机器人、凌云光、大恒图像、华数机器人五家机器视觉公司，助力用户科学决策。

# 视觉智能开放平台 # 人工智能 # 运维 # 算法 # 机器人 # 新制造

CV技术指南（公众号）

|

博文

|

来自：视觉智能

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

OCR文字识别在目前有着比较好的应用，也出现了很多的文字识别软件，但软件是面向用户的。对于我们技术人员来说，有时难免需要在计算机视觉任务中加入文字识别，如车牌号识别，票据识别等，因此软件对我们是没用的，我们需要自己实现文字识别。

# 文字识别 # 视觉智能开放平台 # 文字识别 # 计算机视觉 # C++ # Python

鸡蛋灌饼儿

|

问答

|

来自：视觉智能

调用OCR全文识别高精版C# 使用OCR SDK 本地图片转成流请求后提示 url为空。这是什么问题

# 文字识别 # 视觉智能开放平台 # 文字识别 # C# # 开发工具

真的很搞笑

|

问答

|

来自： ModelScope模型即服务

ModelScope怎么下载模型文件？

# 视觉智能开放平台

崔问问

|

问答

|

来自： ModelScope模型即服务

在ModelScope中，这个下载文件是模型文件吗？存储路径能改吗？

# 视觉智能开放平台 # 存储

阿里云OpenVI

|

博文

|

来自：视觉智能

【OpenVI-通用检测系列之图像实例分割】（CVPR 2023）快速实例分割框架FasInst

论文链接：https://arxiv.org/abs/2303.08594

# 视觉智能开放平台 # 机器学习/深度学习 # 算法 # 自动驾驶 # 数据挖掘 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台