大家好这里是三岁,今天给大家带来的是在AiStudio项目平台的一个精选项目,虽然很短,但是效果拔群,使用到了最近特别火的paddleOCR~~~
项目地址:https://aistudio.baidu.com/aistudio/projectdetail/706200
网课看完笔油见底,两手酸酸,
头皮麻麻,本子满满密密麻麻。
你还在为网课抄不完的笔记烦恼嘛?
你还在为网课那弄不完的无底洞头疼嘛?
你们的救星来了!!!!
接下来就带大家一起看看吧!
模块介绍
本次使用的OCR模型是haddlehubOCR chinese_ocr_db_crnn_server的1.1.0版本。
chinese_ocr_db_crnn_server Module用于识别图片当中的汉字。其基于chinese_text_detection_db_server检测得到的文本框,继续识别文本框中的中文文字。
之后对检测文本框进行角度分类。
最终识别文字算法采用CRNN(Convolutional Recurrent Neural Network)即卷积递归神经网络。
其是DCNN和RNN的组合,专门用于识别图像中的序列式对象。
与CTC loss配合使用,进行文字识别,可以直接从文本词级或行级的标注中学习,不需要详细的字符级的标注。
该Module是一个通用的OCR模型,支持直接预测。
环境配置
该Module依赖于第三方库shapely和pyclipper,使用该Module之前,请先安装shapely和pyclipper
hub install chinese_ocr_db_crnn_mobile==1.1.0 # 安装有关版本的ocr模块 pip install shapely pip install pyclipper
文件处理
### 判定有无规定文件夹 import os #导入os库 path = './images/'; # 将视频切割为图片存放的路径 if os.path.exists(path): print('文件夹已经存在') else: os.mkdir(path) #不存在即创建 print('创建成功')
视频分割
对视频进行分割得到图片
## 把视频按照一定的帧进行切割生成照片并存储到指定文件 import cv2 vc = cv2.VideoCapture(r'./ceshs.mp4') # 读入视频文件,命名cv n = 1 # 计数 if vc.isOpened(): # 判断是否正常打开 rval, frame = vc.read() else: rval = False timeF = 15 # 视频帧计数间隔频率 i = 0 while rval: # 循环读取视频帧 rval, frame = vc.read() try: if (n % timeF == 0): # 每隔timeF帧进行存储操作 i += 1 cv2.imwrite(r''+path+'{}.jpg'.format(i),frame) # 存储为图像 n = n + 1 cv2.waitKey(1) except: break vc.release()
OCR对文件进行处理
### 把有关的文件进行遍历后使用OCR进行生成文字。 import paddlehub as hub import cv2 import matplotlib.pyplot as plt import matplotlib.image as mpimg import os data = os.listdir(path) #读取保存图片的文件夹 for photo in data: print(photo) lena = mpimg.imread(f'./images/{photo}') plt.figure(figsize=(10,10)) # lena.shape plt.imshow(lena) plt.axis('off') plt.show() ocr = hub.Module(name="chinese_ocr_db_crnn_mobile") try: result = ocr.recognize_text(images=[cv2.imread(f'./images/{photo}')]) except: pass # result = ocr.recognize_text(images=[cv2.imread('/PATH/TO/IMAGE')]) # result = ocr.recognize_text(paths=['/PATH/TO/IMAGE']) for text in result[0]['data']: print(text['text'])
9.jpg
[2020-10-30 17:55:33,430] [ INFO] - Installing chinese_ocr_db_crnn_mobile module [2020-10-30 17:55:33,616] [ INFO] - Module chinese_ocr_db_crnn_mobile already installed in /home/aistudio/.paddlehub/modules/chinese_ocr_db_crnn_mobile [2020-10-30 17:55:33,927] [ INFO] - Installing chinese_text_detection_db_mobile module-1.0.3 [2020-10-30 17:55:33,929] [ INFO] - Module chinese_text_detection_db_mobile-1.0.3 already installed in /home/aistudio/.paddlehub/modules/chinese_text_detection_db_mobile 人工智能无处不在 1/飞桨 搜素引擎:网页、图片、视频、新闻、学术、地图 信息推荐:新闻、商品、游戏、书籍 智能助理 图片识别:人像、用品、动物、交通工具 用户分析:社交网络、影评、商品评论 智能图像 理解 机器翻译、摘要生成. 逻辑操作符 描述 机器翻译 and 网络购物 如果两个操作数中的任何一个为True则eondition变为True 期 智能化推荐 not 用于反转逻(不是False变为True. 11.jpg
[2020-10-30 17:55:38,871] [ INFO] - Installing chinese_ocr_db_crnn_mobile module [2020-10-30 17:55:38,983] [ INFO] - Module chinese_ocr_db_crnn_mobile already installed in /home/aistudio/.paddlehub/modules/chinese_ocr_db_crnn_mobile [2020-10-30 17:55:39,389] [ INFO] - Installing chinese_text_detection_db_mobile module-1.0.3 [2020-10-30 17:55:39,504] [ INFO] - Module chinese_text_detection_db_mobile-1.0.3 already installed in /home/aistudio/.paddlehub/modules/chinese_text_detection_db_mobile 人工智能无处不在 1/飞浆 搜素引擎:网页、图片、视频、新闻、学术、地图 信息推荐:新闻、商品、游戏、书籍 智能助理 图片识别:人像、用品、动物、交通工具 用户分析:社交网络、影评、商品评论 智能图像 理解 机器翻译、摘要生成. 逻辑操作符 描述 机器翻译 and 网络购物 如果两个操作数中的任何一个为True则eondition变为Trua 期 智能化推荐 not 用于反转逻辑(不是False变为True. 以上为部分结果!
好了今天就水 到这里了,希望大家多多支持!