视觉智能开放平台的搜索结果_热门_第14页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用，支持人物与服装照片智能合成，可生成多达10种试穿效果版本，并提供自定义提示词优化功能。

# 视觉智能开放平台 # 人工智能 # API # 计算机视觉 # 开发者 # Python

游客pj7nlkcvhvppi

|

29天前

|

博文

|

来自： ModelScope模型即服务

DeepSeek-OCR开源即获7k+星，首创“上下文光学压缩”技术，仅用100视觉token超越传统OCR模型256token性能，压缩比达10-20倍，精度仍超97%。30亿参数实现单卡日处理20万页，显著降低大模型长文本输入成本，重新定义高效文档理解新范式。

# 视觉智能开放平台 # 编解码 # 人工智能 # 文字识别 # 测试技术 # 开发者

游客5q7sd2dhbjbdo

|

14天前

|

问答

|

来自：大数据与机器学习

android 混淆异常，印象中貌似是引入金融级活体检测sdk，开启混淆后编译就报错

# 视觉智能开放平台 # Android开发 # 开发工具

GoAlaaa

|

博文

|

来自：视觉智能

CRNN文字识别

近几年来，CRNN在计算机视觉文本识别领域取得不错成果。CRNN是一种卷积循环神经网络结构，用于解决基于图像的序列识别问题，特别是场景文字识别问题。CRNN网络实现了不定长验证结合CNN和RNN网络结构，使用双向LSTM循环网络进行时序训练，并在最后引入CTC损失函数来实现端对端的不定长序列识别，

# 文字识别 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 算法 # 数据挖掘 # 计算机视觉 # Perl

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

关键点检测从入门到进阶

关键点检测，也被称作关键点定位或关键点对齐（keypoint alignment），在不同的任务中名字可能略有差异。比如，在人脸关键点定位中会被称作facemark alignment，在人体关键点检测中称作pose alignment。

# 视觉智能开放平台 # GPU云服务器 # 机器学习/深度学习 # 人工智能 # 编解码 # JSON # 数据可视化 # 开发工具 # 数据安全/隐私保护 # 计算机视觉 # 数据格式 # 异构计算

老乡别走

|

博文

|

来自：视觉智能

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

该软件是一款OCR身份证识别工具，能批量处理图片，自动提取身份证信息并导出为Excel。支持百度网盘和腾讯云盘下载。用户界面直观，操作简单，适合新手。识别过程包括：打开图片、一键识别、导出结果。特别注意，此程序仅适用于身份证识别，不适用于其他类型的图片识别。

# 视觉智能开放平台 # 文字识别

shliang0603

|

博文

|

来自：视觉智能

海康威视工业相机SDK+Python+PyQt开发数据采集系统（支持软件触发、编码器触发）

该系统基于海康威视工业相机SDK，使用Python与PyQt开发，支持Gige与USB相机设备的搜索及双相机同时显示。系统提供软件触发与编码器触发模式，并可在数据采集过程中实时保存图像。此外，用户可以调节曝光时间和增益，并进行信息输入，这些信息将被保存至配置文件以便下次自动加载。参数调节与实时预览等功能进一步增强了系统的实用性。

# 视觉智能开放平台 # 数据采集 # 开发工具 # Python

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（六十）使用国产的ijkplayer播放器观看网络视频

ijkplayer是由Bilibili基于FFmpeg3.4研发并开源的播放器，适用于Android和iOS，支持本地视频及网络流媒体播放。本文详细介绍如何在新版Android Studio中导入并使用ijkplayer库，包括Gradle版本及配置更新、导入编译好的so文件以及添加直播链接播放代码等步骤，帮助开发者顺利进行App调试与开发。更多FFmpeg开发知识可参考《FFmpeg开发实战：从零基础到短视频上线》。

# 视觉智能开放平台 # Linux # 开发工具 # Android开发 # iOS开发 # 开发者

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

VITRON：开源像素级视觉大模型，同时满足图像与视频理解、生成、分割和编辑等视觉任务

VITRON 是由 Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大模型，支持图像与视频的理解、生成、分割和编辑，适用于多种视觉任务。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # 并行计算 # 前端开发 # PyTorch

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

SeedVR：高效视频修复模型，支持任意长度和分辨率，生成真实感细节

SeedVR 是南洋理工大学和字节跳动联合推出的扩散变换器模型，能够高效修复低质量视频，支持任意长度和分辨率，生成真实感细节。

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 人工智能 # 测试技术 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台