视觉智能开放平台的搜索结果_热门_第20页-阿里云开发者社区

阿里云OpenVI

|

博文

|

来自：视觉智能

【OpenVI-通用检测系列之图像实例分割】（CVPR 2023）快速实例分割框架FasInst

论文链接：https://arxiv.org/abs/2303.08594

# 视觉智能开放平台 # 机器学习/深度学习 # 算法 # 自动驾驶 # 数据挖掘 # 计算机视觉

lyraestar-23206

|

博文

|

来自：视觉智能

AIGC图像分辨率太低？快来试试像素感知扩散超分模型，你想要的细节都在这里

阿里巴巴最新自研的像素感知扩散超分模型已经开源，它把扩散模型强大的生成能力和像素级控制能力相结合，能够适应从老照片修复到AIGC图像超分的各种图像增强任务和各种图像风格，并且能够控制生成强度和增强风格。这项技术的直接应用之一是AIGC图像的后处理增强和二次生成，能够带来可观的效果提升。

# 视觉智能开放平台 # 编解码 # 人工智能 # 移动开发 # 算法 # 搜索推荐

lian8306

|

博文

|

来自： ModelScope模型即服务

Stable Diffusion 介绍与入门

Stable Diffusion 介绍与入门，简单的介绍

# 视觉智能开放平台 # 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 计算机视觉

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（三十）解析H.264码流中的SPS帧和PPS帧

《FFmpeg开发实战》书中介绍了音视频编码历史，重点讲述H.264的成功在于其分为视频编码层和网络抽象层。H.264帧类型包括SPS(序列参数集，含视频规格参数)，PPS(图像参数集，含编码参数)和IDR帧(立即解码刷新，关键帧)。SPS用于计算视频宽高和帧率，PPS存储编码设置，IDR帧则标志新的解码序列。书中还配以图片展示各帧结构详情，完整内容可参考相关书籍。

# 云解析DNS # 视觉智能开放平台 # 存储 # 编解码

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（三十八）APP如何访问SRS推流的RTMP直播地址

《FFmpeg开发实战》书中介绍了轻量级流媒体服务器MediaMTX，适合测试RTSP/RTMP协议，但不适用于复杂直播场景。SRS是一款强大的开源流媒体服务器，支持多种协议，起初为RTMP，现扩展至HLS、SRT等。在FFmpeg 6.1之前，推送给SRS的HEVC流不受支持。要播放RTMP流，Android应用可使用ExoPlayer，需在`build.gradle`导入ExoPlayer及RTMP扩展，并根据URL类型创建MediaSource。若SRS播放黑屏，需在配置文件中开启`gop_cache`以缓存关键帧。

# 视觉智能开放平台 # Web App开发 # 缓存 # 编解码 # 小程序 # Android开发

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

VE-Bench：北京大学开源首个针对视频编辑质量的评估指标，从多角度考虑审美并准确地评估视频编辑效果

北京大学开源了首个针对视频编辑质量评估的新指标 VE-Bench，旨在通过人类感知一致的度量标准，更准确地评估视频编辑效果。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 算法 # 数据库

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

VITRON：开源像素级视觉大模型，同时满足图像与视频理解、生成、分割和编辑等视觉任务

VITRON 是由 Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大模型，支持图像与视频的理解、生成、分割和编辑，适用于多种视觉任务。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # 并行计算 # 前端开发 # PyTorch

1652126143653740

|

4月前

|

博文

|

来自：视觉智能

OBS美颜美肌插件安装使用教程

软件是不自带美颜插件的，可以安装OBS-Studio-29.1.3安装包，就自带美颜功能的插件。在OBS软件【插件中心】菜单下,打开【打开插件中心】，安装美颜摄像头注册即可。在OBS软件【停靠窗口】菜单下，打开【美颜参数控制面板】的美颜窗口。插件里面有自带教程，可以自行学习。

# 视觉智能开放平台

CV技术指南（公众号）

|

博文

|

来自：视觉智能

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

OCR文字识别在目前有着比较好的应用，也出现了很多的文字识别软件，但软件是面向用户的。对于我们技术人员来说，有时难免需要在计算机视觉任务中加入文字识别，如车牌号识别，票据识别等，因此软件对我们是没用的，我们需要自己实现文字识别。

# 文字识别 # 视觉智能开放平台 # 文字识别 # 计算机视觉 # C++ # Python

鸡蛋灌饼儿

|

问答

|

来自：视觉智能

调用OCR全文识别高精版C# 使用OCR SDK 本地图片转成流请求后提示 url为空。这是什么问题

# 文字识别 # 视觉智能开放平台 # 文字识别 # C# # 开发工具

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台