视觉智能开放平台的搜索结果_文章_第4页-阿里云开发者社区

AI小怪兽

|

3月前

|

博文

|

本文提出SPMamba-YOLO水下目标检测模型：创新融合SPPELAN（增强多尺度特征与感受野）、PSA注意力（抑制背景、提升小目标判别）及Mamba状态空间模块（建模长程依赖），在URPC2022上mAP@0.5达82.5%，超越YOLOv8n 4.9%。

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 算法 # 固态存储 # 计算机视觉

AI小怪兽

|

3月前

|

博文

|

来自： ModelScope模型即服务

基于YOLO11的交通违规检测系统（Python源码+数据集+Pyside6界面）

本文基于YOLO11构建交通违规检测系统，涵盖23类目标（车辆、信号灯、标志等），详解数据制作（ROI裁剪优化尺度）、模型改进（C3k2、C2PSA、轻量Detect头）及训练可视化全过程，并集成PySide6实现GUI应用，助力工业落地。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 数据可视化 # 计算机视觉 # Python

agal5yxttdffg

|

3月前

|

博文

|

来自：视觉智能

基于云原生架构的 AIGC 视频后处理实践：应对扩散模型纹理挑战

随着 AIGC 视频生成规模化应用，视频后处理能力逐渐成为系统吞吐与质量保障的关键环节。本文结合实际工程实践，分析扩散模型生成视频在高频纹理与时间一致性方面的挑战，并探讨基于云原生架构的 GPU 化后处理方案。通过引入生成式重构与弹性算力调度，实现视频修复性能与吞吐能力的显著提升。

# 视觉智能开放平台 # Cloud Native # 算法 # 测试技术 # 对象存储 # 异构计算

zfhvx64ydb4r6

|

3月前

|

博文

|

来自： ModelScope模型即服务

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

VSR（video-subtitle-remover）是一款开源AI视频去字幕工具，支持本地运行，无需上传数据。它融合STTN、LaMa、ProPainter三大前沿修复模型，可智能检测并擦除硬字幕/水印，保持原分辨率与画质。兼容CUDA/DirectML，适配NVIDIA/AMD/Intel显卡，兼顾隐私性、可控性与高性能。

# 视觉智能开放平台 # 人工智能 # 并行计算 # 算法 # 异构计算 # Python

zfhvx64ydb4r6

|

3月前

|

博文

|

来自：视觉智能

视频后期黑科技：深度拆解开源 VSR 架构与视频 Inpainting 实践全指南

本文深度解析视频补全（Video Inpainting）前沿技术，聚焦硬字幕去除工具VSR的底层架构（OCR定位、时序传播、光流对齐）、本地部署要点（CUDA环境、显存优化）及云端方案（550W AI扩散模型），对比二者在隐私、效率与画质上的差异，助力开发者科学选型。（239字）

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 并行计算 # 开发者

游客3fppupzah4b56

|

4月前

|

博文

|

来自：视觉智能

AI Glasses识别百变脸谱

本项目提出“AI脸谱眼镜”方案：通过端云协同架构，结合人脸检测、EasyDL脸谱识别、戏曲百科与AR投射技术，让观众佩戴眼镜即可实时获取京剧角色名、性格、行当等信息。卡片投射于视野下方，不遮挡表演，专为戏迷、游客及学生设计，助力传统文化沉浸式普及。（239字）

# 视觉智能开放平台 # 人工智能 # JSON # 算法 # 数据可视化 # vr&ar

翌水枭寒ym

|

4月前

|

博文

|

来自：视觉智能

当AI Glasses走进小吃街，实现美食百科

这是一款面向吃货的AI眼镜系统，融合图像识别、美食百科与AR投射技术。用户扫视小吃，即刻获取名称、热量、辣度、成分及推荐指数等信息，端云协同实现500ms内响应。支持健康色标（绿/黄/红）、动态百科更新与场景化提示，让逛吃更聪明、更安心。（239字）

# 视觉智能开放平台 # 传感器 # 人工智能 # Java # API # vr&ar

zfhvx64ydb4r6

|

4月前

|

博文

|

来自：视觉智能

AI视频去字幕技术完全指南：原理、方法与工具对比（2026版）

本文深度解析AI视频去字幕技术，涵盖原理（OCR检测+GAN修复+时序一致性）、主流工具横评、分步实操教程及短视频、教育、影视等六大行业应用。适合创作者、自媒体人与技术爱好者，20分钟掌握高效去字幕方法。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 自然语言处理 # 计算机视觉

极客小云

|

4月前

|

博文

|

来自：视觉智能

【ComfyUI API 自动化利器：comfyui_xy Python 库使用详解】

`comfyui_xy` 是一个轻量级 Python 客户端库，封装 ComfyUI API，支持一键上传图片/遮罩、动态修改工作流、自动排队执行与结果下载（图/视/音频）。安装即用，无需处理底层 HTTP/WebSocket 细节，助力 AIGC 自动化开发。开源免费，PyPI 可装。

# 视觉智能开放平台 # JSON # 人工智能 # API # 数据格式 # Python

步里软件

|

5月前

|

博文

|

来自：视觉智能

【编号2571】AI 文生图 & 图生图工具开发与应用经验：高效解决批量图文生成痛点

AI 文生图工具，AI 图生图工具，Python AI 图文生成，批量生成无水印图片，Selenium 浏览器自动化，TKinter 界面开发，AI 生成图片去水印，批量图生图参数配置，参考图批量生成，AI 图文生成错误恢复

# 视觉智能开放平台 # 人工智能 # 前端开发 # 数据安全/隐私保护 # 索引 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台