视觉智能开放平台的搜索结果_热门_第16页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用，支持人物与服装照片智能合成，可生成多达10种试穿效果版本，并提供自定义提示词优化功能。

# 视觉智能开放平台 # 人工智能 # API # 计算机视觉 # 开发者 # Python

月同学不写Bug

|

博文

|

来自：视觉智能

图像分割语义分割 Augmentor数据增强（数据扩充）

一句话：使用Augmentor创建一个对象，向对象里添加各种带有概率值和参数的图像操作，使用该对象处理你的原始图像。

# 视觉智能开放平台 # 机器学习/深度学习 # 算法 # 计算机视觉 # Python

AI小怪兽

|

博文

|

来自： ModelScope模型即服务

一种基于YOLOv8改进的高精度红外小目标检测算法（原创自研）

【7月更文挑战第2天】 💡💡💡创新点： 1）SPD-Conv特别是在处理低分辨率图像和小物体等更困难的任务时优势明显； 2）引入Wasserstein Distance Loss提升小目标检测能力； 3）YOLOv8中的Conv用cvpr2024中的DynamicConv代替；

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 算法 # 计算机视觉

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

Cobalt：开源的流媒体下载工具，支持解析和下载全平台的视频、音频和图片，支持多种视频质量和格式，自动提取视频字幕

cobalt 是一款开源的流媒体下载工具，支持全平台视频、音频和图片下载，提供纯净、简洁无广告的体验

# 云解析DNS # 视觉智能开放平台 # 人工智能 # 搜索推荐 # API # Docker # 容器

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，支持文生视频、图生视频，最高支持4K分辨率，广泛应用于内容创作、教育、广告等领域。

# 视觉智能开放平台 # 人工智能 # 编解码

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Sitcom-Crafter：动画师失业警告！AI黑科技自动生成3D角色动作，剧情脚本秒变动画

Sitcom-Crafter 是一款基于剧情驱动的 3D 动作生成系统，通过多模块协同工作，支持人类行走、场景交互和多人交互，适用于动画、游戏及虚拟现实等领域。

# 视觉智能开放平台 # 数据采集 # 机器学习/深度学习 # 人工智能 # vr&ar # 异构计算

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Step-Video-TI2V：开源视频生成核弹！300亿参数+102帧电影运镜

Step-Video-TI2V 是阶跃星辰推出的开源图生视频模型，支持根据文本和图像生成高质量视频，具备动态性调节和多种镜头运动控制功能，适用于动画制作、短视频创作等场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 监控

Holly007

|

1月前

|

博文

|

来自：视觉智能

AI内容创作Agent架构解析：基于移动端原生框架的内容特工队AI (ReelsAgent)与传统短视频工具的技术差异

传统的AI视频工具链往往基于单点功能堆栈或PC/Web端的SaaS架构，难以承载短视频营销所需的高频、高并发、全流程自动化需求。本文将从AI Agent系统架构角度，对比内容特工队AI (ReelsAgent)的移动端原生设计与现有主流工具的实现路径，以评估其在工程实践中的优劣。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # API # 微服务

多麻辣哦

|

问答

|

来自： ModelScope模型即服务

ModelScope中，请问用户可以免费使用的存储空间有限制吗？请问模型hub存储的空间限制是多大呢

# 视觉智能开放平台 # 存储

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Director：构建视频智能体的 AI 框架，用自然语言执行搜索、编辑、合成和生成等复杂视频任务

Director 是一个构建视频智能体的 AI 框架，用户可以通过自然语言命令执行复杂的视频任务，如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施，集成了多个预构建的视频代理和 AI API，支持高度定制化，适用于开发者和创作者。

# 自然语言处理 # 视觉智能开放平台 # 人工智能 # 自然语言处理 # 前端开发 # API # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台