视觉智能开放平台的搜索结果_热门_第13页-阿里云开发者社区

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

ViTPose：最小只有100M的身体姿态估计模型，精确识别人体关节、手、脚等关键点

ViTPose 是基于 Transformer 架构的人体姿态估计模型，能够精准定位人体关键点，支持多种规模版本，适用于运动分析、虚拟现实等场景。

# 视觉智能开放平台 # 人工智能 # 编解码 # 测试技术 # 人机交互 # vr&ar

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Light-A-Video：好莱坞级打光自由！上海AI Lab开源视频打光AI，无需训练秒改画面氛围，3步让阴天变夕阳

Light-A-Video 是由上海AI Lab联合交大等高校推出的无需训练的视频重照明方法，支持高质量、时间一致的光照控制，零样本生成和前景背景分离处理。

# 视觉智能开放平台 # 人工智能 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

TripoSR：开源3D生成闪电战！单图0.5秒建模，Stability AI颠覆设计流程

TripoSR是由Stability AI和VAST联合推出的开源3D生成模型，能在0.5秒内从单张2D图像快速生成高质量3D模型，支持游戏开发、影视制作等多领域应用。

# 视觉智能开放平台 # 人工智能 # 并行计算 # PyTorch # 数据处理 # 异构计算

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

EasyControl Ghibli是基于扩散模型的AI工具，通过条件注入技术将普通照片转化为吉卜力动画风格，仅需100张训练样本即可精准还原标志性光影与色调特征。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 缓存 # 物联网

AI小怪兽

|

博文

|

来自：视觉智能

YOLO26如何训练自己的数据集 | （NEU-DET为案列）

本文详解YOLO26全新架构：移除DFL、端到端无NMS推理、ProgLoss+STAL损失策略及MuSGD优化器；并以NEU-DET数据集为例，详述训练全流程（含预训练/优化器选择/模型缩放对比），附结构图、代码与可视化结果。

# 视觉智能开放平台 # 机器学习/深度学习 # 数据可视化 # 测试技术 # 计算机视觉 # 人工智能

侠客工坊

|

3月前

|

博文

|

来自：视觉智能

企业级数字员工落地：侠客工坊从端侧视觉推理到云原生数据治理的架构思考

本文介绍“侠客工坊”端云协同架构：以事件驱动解耦云端与海量移动端，通过轻量化视觉模型实现端侧自治；采用原生事件驱动保障合规安全；构建冷热分层数据治理体系，500TB多模态数据高效归档至OSS深冷存储，为B2B企业打造高可用、强合规的数字员工基础设施。

# 视觉智能开放平台 # 存储 # 人工智能 # 自然语言处理 # Cloud Native # 对象存储

游客uoavtldjfd7qo

|

9天前

|

问答

|

来自： ModelScope模型即服务

问了豆包，一开始说是因为app.py没有添加，但添加之后还是发布失败，求解答

# 视觉智能开放平台 # 容器

yma16

|

博文

|

来自：视觉智能

接入阿里视觉智能平台免费体验—人脸人体识别ocr与二次元风格转化使用

# 视觉智能开放平台 # 文字识别 # 开发工具 # 计算机视觉 # 文字识别 # 存储

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（二十）Linux环境给FFmpeg集成AVS3解码器

AVS3，中国制定的第三代音视频标准，是首个针对8K和5G的视频编码标准，相比AVS2和HEVC性能提升约30%。uavs3d是AVS3的解码器，支持8K/60P实时解码，且在各平台有优秀表现。要为FFmpeg集成AVS3解码器libuavs3d，需从GitHub下载最新源码，解压后配置、编译和安装。之后，重新配置FFmpeg，启用libuavs3d并编译安装，通过`ffmpeg -version`确认成功集成。

# 视觉智能开放平台 # 编解码 # Linux # 5G # iOS开发 # Windows

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

LatentSync：根据音频生成高分辨率、动态逼真的唇形同步视频

LatentSync 是由字节跳动与北京交通大学联合推出的端到端唇形同步框架，基于音频条件的潜在扩散模型，能够生成高分辨率、动态逼真的唇同步视频，适用于影视、教育、广告等多个领域。

# 视觉智能开放平台 # 人工智能 # 数据处理

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台