视觉智能开放平台的搜索结果_热门_第5页-阿里云开发者社区

taro_秋刀鱼

|

博文

|

来自：视觉智能

阿里云视觉智能开放平台--文字识别使用教程

文字识别技术是基于阿里云深度学习技术，为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

# 文字识别 # 视觉智能开放平台 # 对象存储 # 机器学习/深度学习 # 文字识别 # Java # API # 对象存储

蚝油菜花

|

12月前

|

博文

|

来自： ModelScope模型即服务

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Manga Image Translator 是一款开源的漫画图片文字翻译工具，支持多语言翻译并能将翻译后的文本无缝嵌入原图，保持漫画的原始风格和布局。该工具基于OCR技术和深度学习模型，提供批量处理和在线/离线翻译功能。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 文字识别 # 计算机视觉

温柔的养猫人

|

博文

|

来自：视觉智能

带你读《深度学习与图像识别：原理与实践》之三：图像分类之KNN算法

这是一部从技术原理、算法和工程实践3个维度系统讲解图像识别的著作，由阿里巴巴达摩院算法专家、阿里巴巴技术发展专家、阿里巴巴数据架构师联合撰写。在知识点的选择上，本书广度和深度兼顾，既能让完全没有基础的读者迅速入门，又能让有基础的读者深入掌握图像识别的核心技术；在写作方式上，本书避开了复杂的数学公式及其推导，从问题的前因后果、创造者的思考过程，利用简单的数学计算来做模型分析和讲解，通俗易懂。更重要的是，本书不仅仅是聚焦于技术，而是将重点放在了如何用技术解决实际的业务问题。

# 图像识别 # 视觉智能开放平台 # 算法 # Python # 机器学习/深度学习 # 数据采集 # 算法框架/工具

多麻辣哦

|

问答

|

来自： ModelScope模型即服务

ModelScope中，模型下载默认路径在哪个路径？

# 视觉智能开放平台

GoAlaaa

|

博文

|

来自：视觉智能

OCR文字识别技术总结（一）

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，经过检测暗、亮的模式肯定其形状，而后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并经过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提升识别正确率，是OCR最重要的课题，ICR（Intelligent Character Recognition）的名词也随之产生。

# 文字识别 # 视觉智能开放平台 # 机器学习/深度学习 # JSON # 文字识别 # 算法 # 安全 # 计算机视觉 # 网络架构 # 数据格式

t-25774453200-61

|

问答

|

来自： ModelScope模型即服务

我希望通过damo-YOLO训练1500*1500的图片

# 视觉智能开放平台

阿里云OpenVI

|

博文

|

来自：视觉智能

【视觉智能产品速递——人物动漫化能力上新】

VIAPI—人物动漫化！新增风格版本发布。产品功能：人物动漫化——输入一张人物图像，生成其二次元卡通形象，返回卡通化后的结果图像。 🔥🔥🔥 本次更新风格：国风工笔画、港漫风

# 图像识别 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 算法 # API

真的很搞笑

|

问答

|

来自： ModelScope模型即服务

ModelScope下载速度慢怎么解决？

# 视觉智能开放平台

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL 是阿里通义千问团队开源的视觉语言模型，具有3B、7B和72B三种不同规模，能够识别常见物体、分析图像中的文本、图表等元素，并具备作为视觉Agent的能力。

# 视觉智能开放平台 # 人工智能 # 编解码 # JSON # 测试技术 # Linux

游客6mpq4uc7irdxi

|

28天前

|

博文

|

来自：视觉智能

程序员都在偷偷用的AI编程神器！2025高效自动写代码工具全解析

AI编程革命正悄然兴起。李响团队调研显示，AI助手大幅提升开发效率，GitHub Copilot、CodeWhisperer、Tabnine各具优势，而新兴的Lynx AI更以自然语言生成全栈应用，零门槛、多端适配，助力开发者从重复劳动中解放，专注创新。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # 安全 # 程序员 # 开发者

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台