备案控制台

开发者社区人工智能文章正文

DL之CNN：基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—训练过程

2021-10-31 196

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

教育场景识别，教育场景识别 200次/月

通用文字识别，通用文字识别 200次/月

车辆物流识别，车辆物流识别 200次/月

简介： DL之CNN：基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—训练过程

输出结果

设计思路

核心代码

from keras.callbacks import ModelCheckpoint, ReduceLROnPlateau

nclass = len(characters) + 1

model, basemodel = get_model_train(height=imgH, nclass=nclass)

import os

if os.path.exists('./models/pretrain_models/keras.hdf5'):

basemodel.load_weights('./models/pretrain_models/keras.hdf5')

checkpointer = ModelCheckpoint(filepath="./models/ intermediate_model/model{epoch:02d}-{val_loss:.4f}.hdf5", monitor='val_loss',

verbose=0, save_weights_only=False, save_best_only=True)

rlu = ReduceLROnPlateau(monitor='val_loss', factor=0.1, patience=1, verbose=0, mode='auto', epsilon=0.0001,

cooldown=0, min_lr=0)

model.fit_generator(gen(train_loader, flag='train'),

steps_per_epoch=1024,

epochs=10000,

validation_data=gen(test_loader, flag='test'),

callbacks=[checkpointer, rlu],

validation_steps=1024)

#保存两个h5文件

model.save_weights('./models/final_model/final_model_weights.h5')

model.save('./models/final_model/final_model.h5')

文章标签：

文字识别

机器学习/深度学习

算法框架/工具

移动开发

算法

关键词：

算法数据集

印刷文字识别图片

印刷文字识别格式

印刷文字识别格式图片

CNN算法

一个处女座的程序猿

目录

相关文章

长梦

|

8月前

|

机器学习/深度学习自然语言处理异构计算

Python深度学习面试：CNN、RNN与Transformer详解

【4月更文挑战第16天】本文介绍了深度学习面试中关于CNN、RNN和Transformer的常见问题和易错点，并提供了Python代码示例。理解这三种模型的基本组成、工作原理及其在图像识别、文本处理等任务中的应用是评估技术实力的关键。注意点包括：模型结构的混淆、过拟合的防治、输入序列长度处理、并行化训练以及模型解释性。掌握这些知识和技巧，将有助于在面试中展现优秀的深度学习能力。

长梦

270 11 11

JOYCE_Leo16

|

8月前

|

机器学习/深度学习人工智能移动开发

一文搞懂 FFN / RNN / CNN 的参数量计算公式！！

一文搞懂 FFN / RNN / CNN 的参数量计算公式！！

JOYCE_Leo16

413 3 3

三分钟热度的鱼

|

6月前

|

文字识别数据可视化数据处理

印刷文字识别使用问题之已经训练的数据集是否可以删除

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

41 7 7

算法金

|

6月前

|

机器学习/深度学习人工智能自然语言处理

算法金 | 秒懂 AI - 深度学习五大模型：RNN、CNN、Transformer、BERT、GPT 简介

**RNN**，1986年提出，用于序列数据，如语言模型和语音识别，但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**，1989年引入，擅长图像处理，卷积层和池化层提取特征，经典应用包括图像分类和物体检测，如LeNet-5。 **Transformer**，2017年由Google推出，自注意力机制实现并行计算，优化了NLP效率，如机器翻译。 **BERT**，2018年Google的双向预训练模型，通过掩码语言模型改进上下文理解，适用于问答和文本分类。

算法金

186 9 9

小空门123-30335

|

6月前

|

机器学习/深度学习 PyTorch 算法框架/工具

图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型（如卷积神经网络CNN和循环神经网络RNN）不同，

图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型（如卷积神经网络CNN和循环神经网络RNN）不同，

小空门123-30335

138 9 9

VipSoft

|

5月前

|

数据采集机器学习/深度学习文字识别

OCR -- 文本检测 - 训练DB文字检测模型

OCR -- 文本检测 - 训练DB文字检测模型

VipSoft

129 0 0

算法金

|

6月前

|

机器学习/深度学习数据采集监控

算法金 | DL 骚操作扫盲，神经网络设计与选择、参数初始化与优化、学习率调整与正则化、Loss Function、Bad Gradient

**神经网络与AI学习概览** - 探讨神经网络设计，包括MLP、RNN、CNN，激活函数如ReLU，以及隐藏层设计，强调网络结构与任务匹配。 - 参数初始化与优化涉及Xavier/He初始化，权重和偏置初始化，优化算法如SGD、Adam，针对不同场景选择。 - 学习率调整与正则化，如动态学习率、L1/L2正则化、早停法和Dropout，以改善训练和泛化。

算法金

62 0 0

算法金 | DL 骚操作扫盲，神经网络设计与选择、参数初始化与优化、学习率调整与正则化、Loss Function、Bad Gradient

东方睿赢

|

6月前

|

机器学习/深度学习人工智能自然语言处理

计算机视觉借助深度学习实现了革命性进步，从图像分类到复杂场景理解，深度学习模型如CNN、RNN重塑了领域边界。

【7月更文挑战第2天】计算机视觉借助深度学习实现了革命性进步，从图像分类到复杂场景理解，深度学习模型如CNN、RNN重塑了领域边界。AlexNet开启新时代，后续模型不断优化，推动对象检测、语义分割、图像生成等领域发展。尽管面临数据隐私、模型解释性等挑战，深度学习已广泛应用于安防、医疗、零售和农业，预示着更智能、高效的未来，同时也强调了技术创新、伦理考量的重要性。

东方睿赢

83 1 1

Deephub

|

8月前

|

机器学习/深度学习自然语言处理测试技术

SUPRA：无须额外训练，将Transformer变为高效RNN，推理速度倍增

`Transformers`模型因其在多种任务上的优秀性能而广泛采用，但其内存需求和推理成本随词元数量指数增长。为解决这一问题，论文《Linearizing Large Language Models》提出`SUPRA`方法，将预训练的`Transformers`转换为递归神经网络（RNN），实现有效推理并降低训练成本至原来的5%。`SUPRA`通过将注意力机制线性化并用`GroupNorm`替代`softmax`，保持预训练模型的优势。经过微调，转换后的模型在标准语言理解和长上下文任务中保持高性能，展示了在长序列处理方面的潜力，但仍有改进空间。

Deephub

168 2 2

阿旭算法与机器学习

|

7月前

|

机器学习/深度学习自然语言处理 PyTorch

【从零开始学习深度学习】34. Pytorch-RNN项目实战：RNN创作歌词案例--使用周杰伦专辑歌词训练模型并创作歌曲【含数据集与源码】

【从零开始学习深度学习】34. Pytorch-RNN项目实战：RNN创作歌词案例--使用周杰伦专辑歌词训练模型并创作歌曲【含数据集与源码】

阿旭算法与机器学习

142 0 1

热门文章

最新文章

基于CNN卷积神经网络的金融数据预测matlab仿真,对比BP,RBF,LSTM

机器学习算法的优化与改进：提升模型性能的策略与方法

深度强化学习中SAC算法：数学原理、网络架构及其PyTorch实现

架构学习：7种负载均衡算法策略

基于DWA优化算法的机器人路径规划matlab仿真

室内障碍物射线追踪算法matlab模拟仿真

基于Retinex算法的图像去雾matlab仿真

通过算法备案之后就万事大吉了么？

Enhance-A-Video：上海 AI Lab 推出视频生成质量增强算法，显著提升 AI 视频生成的真实度和细节表现

基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法

C# 通过阿里云 API 实现企业营业执照OCR识别

论文介绍：TextMonkey——面向文本理解的无OCR大型多模态模型

Star33.1k！推荐一个基于网页的OCR（光学字符识别）引擎库

【C/C++ OCR识别】深入探索：Qt C++与OCR识别的完美结合

文字识别OCR常见问题之本地部署如何解决

文字识别OCR常见问题之发票真伪查询有接口如何解决

文字识别OCR常见问题之支持香港和澳门的营业执照识别如何解决

文字识别OCR常见问题之识别一些截图的模式如何解决

文字识别OCR常见问题之处理产品图片识别如何解决

文字识别OCR常见问题之滴滴行程单无法识别（png上传）如何解决

相关课程

更多

智能运维赛（复赛）：利用数据和算法，快速定位系统异常并进行根因分析

智能创作赛（复赛）：相册应用中的视频故事生成算法介绍

智能创作赛（初赛）：相册应用中的故事生成算法介绍

相册服务中的故事生成算法介绍

Go语言核心编程 - 数据结构和算法

神经网络概览及算法详解

相关电子书

更多

图解算法小抄

机器能理解上下文吗-RNN和LSTM神经网络的原理及应用

利⽤CNN实现⽆需联⽹的图像识别

相关实验场景

更多

如何快速训练大模型

AI克隆声音，基于函数计算部署GPT-Sovits语音生成模型

使用PAI-快速开始，低代码实现大语言模型微调和部署

使用Swing算法实现商品推荐

AIGC Stable Diffusion文生图Lora模型微调实现虚拟上装

RSA非对称加密算法

下一篇

DataWorks售前咨询