视觉智能开放平台的搜索结果_热门_第2页-阿里云开发者社区

taro_秋刀鱼

|

博文

|

图像识别服务（Image Recognition）基于大数据和深度学习实现，可精准识别图像中的视觉内容，包括上千种物体标签、数十种常见场景等，包含场景分类、图像打标、鉴黄等在线API服务模块，应用于智能相册管理、图片分类和检索、图片安全监控等场景。

# 图像识别 # 密钥管理服务 # 视觉智能开放平台 # Java # JSON # JavaScript # 数据安全/隐私保护 # 数据格式

云攻略小攻

|

博文

|

来自：云原生

阿里云新品发布会周刊第55期丨神结合！一招玩转K8s和微服务治理

新产品、新版本、新技术、新功能、价格调整，评论在下方，下期更新！关注更多新品发布会！

# 容器服务Kubernetes版 # 云原生数据仓库AnalyticDB MySQL版 # 人工智能平台 PAI # 云服务器 ECS # 视觉智能开放平台 # 云数据库 RDS SQL Server 版 # 云原生大数据计算服务 MaxCompute # 云数据库 RDS MySQL 版 # 机器学习/深度学习 # Kubernetes # 安全 # 微服务 # 容器 # 运维 # Cloud Native # 关系型数据库 # 数据库 # 开发者

阿里云视觉智能开放平台

|

博文

|

来自：视觉智能

视觉智能开放平台【图像增强】【目标检测】上线新算法啦！各种黑科技等你体验~

尊敬的开发者您好，感谢您对阿里云视觉智能平台的支持，近期平台在【图像增强】【目标检测】大类下上线了7个视觉AI算法，分别是图像隐形文字水印、图像隐形图片水印、图像去水印、图像去字幕、物体检测、白底图检测以及透明图检测，接下来给您逐一介绍下。

# 视觉智能开放平台 # 人工智能 # 算法 # 数据安全/隐私保护 # 计算机视觉 # 开发者

行者武松

|

博文

|

来自：视觉智能

图像识别落地B端应用，商业化的“绣球”先抛给了哪些行业？

# 图像识别 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 监控 # 算法 # 大数据

taro_秋刀鱼

|

博文

阿里云视觉智能开放平台--人脸识别使用教程(使用本地图片)

前面在博客：阿里云视觉智能开放平台--人脸识别使用教程介绍了如何在智能视觉开放平台使用人脸识别的接口，示例主要演示了1:N人脸查找的使用流程，使用的是OSS的图片，发现很多同学对本地图片的使用疑问较多，这里以人脸属性识别API为例演示如何使用本地图片。

# 视觉智能开放平台 # API # 开发工具 # 对象存储 # 计算机视觉

温柔的养猫人

|

博文

|

来自：视觉智能

带你读《深度学习与图像识别：原理与实践》之三：图像分类之KNN算法

这是一部从技术原理、算法和工程实践3个维度系统讲解图像识别的著作，由阿里巴巴达摩院算法专家、阿里巴巴技术发展专家、阿里巴巴数据架构师联合撰写。在知识点的选择上，本书广度和深度兼顾，既能让完全没有基础的读者迅速入门，又能让有基础的读者深入掌握图像识别的核心技术；在写作方式上，本书避开了复杂的数学公式及其推导，从问题的前因后果、创造者的思考过程，利用简单的数学计算来做模型分析和讲解，通俗易懂。更重要的是，本书不仅仅是聚焦于技术，而是将重点放在了如何用技术解决实际的业务问题。

# 图像识别 # 视觉智能开放平台 # 算法 # Python # 机器学习/深度学习 # 数据采集 # 算法框架/工具

zfhvx64ydb4r6

|

4月前

|

博文

|

来自： ModelScope模型即服务

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

VSR（video-subtitle-remover）是一款开源AI视频去字幕工具，支持本地运行，无需上传数据。它融合STTN、LaMa、ProPainter三大前沿修复模型，可智能检测并擦除硬字幕/水印，保持原分辨率与画质。兼容CUDA/DirectML，适配NVIDIA/AMD/Intel显卡，兼顾隐私性、可控性与高性能。

# 视觉智能开放平台 # 人工智能 # 并行计算 # 算法 # 异构计算 # Python

启明殿主李长庚

|

4天前

|

博文

|

来自：视觉智能

历史科普视频的AI自动化生产工作流：从全手动到半自动的工程演进

本文量化历史科普视频制作瓶颈，对比全手动（Stable Diffusion/GPT-SoVITS/Manim等开源栈）与半自动（花生AI为核心）方案。实测混合工作流将单期耗时从29–49小时压缩至10–15小时，效率提升60%+，兼顾质量、可控性与落地性。

# 视觉智能开放平台 # 人工智能 # 前端开发 # 物联网 # API # 开发者

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL 是阿里通义千问团队开源的视觉语言模型，具有3B、7B和72B三种不同规模，能够识别常见物体、分析图像中的文本、图表等元素，并具备作为视觉Agent的能力。

# 视觉智能开放平台 # 人工智能 # 编解码 # JSON # 测试技术 # Linux

多麻辣哦

|

问答

|

来自： ModelScope模型即服务

ModelScope中，模型下载默认路径在哪个路径？

# 视觉智能开放平台

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台