文字识别的搜索结果_第2页-阿里云开发者社区

聊聊RPA丨实在智能

|

12天前

|

博文

金融行业RPA案例大全：银行_证券_保险全场景落地实践（附数据）

凌晨两点的金融城灯火通明，RPA“数字员工”正悄然变革行业。从银行对账到证券清算、保险理赔，重复工作被高效替代。实在智能的实在Agent作为第三代RPA，融合AI与大模型，实现智能决策与自主学习，助力金融机构降本增效，推动服务迈向智能化。

# 机器人流程自动化 # 人工智能 # 文字识别 # 自然语言处理 # 监控 # 机器人

小白学大数据

|

13天前

|

博文

基于文本检测的 Python 爬虫弹窗图片定位与拖动实现

# 数据采集 # 文字识别 # JavaScript # 计算机视觉 # Python

2的n次方_

|

15天前

|

博文

面向openEuler操作系统：OCR软件应用部署流程、性能评测

本报告研究在openEuler 22.03 LTS上部署OCR技术，基于Docker容器化实现环境隔离与高效部署，结合PaddleOCR与GPU加速，完成从环境搭建到性能评测的全流程。实验表明，系统在中文识别准确率高达98.7%，单图推理仅250.1毫秒，验证了“openEuler+OCR”方案的可行性与高性能，为AI应用落地提供坚实支撑。

# 文字识别 # Docker # 异构计算 # Python # 容器

Serverless小助手

|

18天前

|

博文

|

来自：云原生

为什么别人用 DevPod 秒启 DeepSeek-OCR，你还在装环境？

DevPod 60秒极速启动，一键运行DeepSeek OCR大模型。告别环境配置难题，云端开箱即用，支持GPU加速、VSCode/Jupyter交互开发，重塑AI原生高效工作流。

# 存储 # 人工智能 # 文字识别 # 并行计算 # 异构计算

小华同学ai

|

23天前

|

博文

一键搞定人脸识别、语音识别、车牌识别本地化！离线跑模型不装框架！！！

SmartJavaAI 是专为 Java 开发者打造的离线 AI 工具箱，集成人脸识别、OCR、语音识别、机器翻译等 20+ 主流模型，基于 DJL + JNI 封装，支持 Maven 一键引入，两行代码调用，让 Java 工程师无需掌握 Python/C++ 即可轻松接入 AI 能力，高效落地各类智能场景。

# 文字识别 # 自然语言处理 # Java # 语音技术 # 计算机视觉

34789737

|

24天前

|

博文

有没有PDF编辑器支持ORC？这款免费的PDF编辑器就可以做到

这是一款支持多平台的全能PDF工具，兼容安卓、苹果手机及电脑。具备PDF与Word、Excel、PPT、图片等格式互转，支持合并、拆分、压缩及OCR识别，内置AI问答与语音朗读功能，操作便捷，适合各类用户高效处理文档。

# XML # 人工智能 # 文字识别 # Android开发 # 数据格式

UE5技术哥

|

25天前

|

博文

「睛」准识人：基于Rokid AI眼镜的智能名片识别与管理系统开发实战

本文基于Rokid CXR-M SDK，构建了一套AI眼镜与手机协同的智能名片识别系统，实现名片拍摄、识别、提取与云端管理一体化。涵盖架构设计、核心算法、交互优化与隐私保护，提供AR+AI融合的高效商务解决方案。

# 人工智能 # 文字识别 # 开发工具 # vr&ar # 数据安全/隐私保护

modelscope

|

25天前

|

博文

|

来自： ModelScope模型即服务

混元OCR模型宣布开源，参数仅1B，多项核心能力SOTA

腾讯混元推出全新开源OCR模型HunyuanOCR，仅1B参数，基于原生多模态架构，实现端到端高效推理。在复杂文档解析、文字检测识别等多场景表现卓越，支持14种小语种翻译，广泛适用于票据抽取、视频字幕识别等应用，多项指标达业界SOTA水平。

# 机器学习/深度学习 # 编解码 # JSON # 文字识别 # 数据格式

modelscope

|

26天前

|

博文

|

来自： ModelScope模型即服务

腾讯混元 HunyuanVideo 1.5 开源！

腾讯混元团队开源HunyuanVideo 1.5，一款8.3B参数的轻量级视频生成模型，基于DiT架构，支持文生视频、图生视频，可在14G显存设备运行，生成5-10秒高清视频，具备强指令响应、流畅动作与电影级画质。

# 机器学习/深度学习 # 编解码 # 自然语言处理 # 文字识别 # ice

游客ltrt7kyr2nprs

|

27天前

|

博文

|

来自：大数据与机器学习

发票验真API：基于权威数据源与阿里云平台的发票验真代码解析

发票验真迈向智能化新阶段，融合OCR识别与权威查验平台，实现全票种自动化验真。一站式接口高效、安全、可溯，支持批量处理与高并发调用，显著提升效率、降低合规风险，助力企业构建智能财税风控体系。（238字）

# 人工智能 # JSON # 文字识别 # 安全 # API

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别