基于PaddleOCR的体检报告识别(一)

本文涉及的产品
通用文字识别,通用文字识别 200次/月
文档理解,结构化解析 100页
票证核验,票证核验 50次/账号
简介: 面对飞速发展互联网医疗时代,医疗信息化建设已经成为医疗行业发展的趋势。经调研,约80%的医学病历是处于非结构化状态的,难以直接被利用而造成了大量医学资源浪费。医疗数据中大量的半结构化与无结构化的文本,医学术语的专业性以及语言表达的多样性为结构化信息抽取带来了很大难度。因此,针对电子病历和报告的信息识别抽取和结构化管理对临床诊断、疾病预防与医学研究具有重要意义。

基于PaddleOCR的体检报告识别


一、项目背景与意义

    面对飞速发展互联网医疗时代,医疗信息化建设已经成为医疗行业发展的趋势。经调研,约80%的医学病历是处于非结构化状态的,难以直接被利用而造成了大量医学资源浪费。医疗数据中大量的半结构化与无结构化的文本,医学术语的专业性以及语言表达的多样性为结构化信息抽取带来了很大难度。因此,针对电子病历和报告的信息识别抽取和结构化管理对临床诊断、疾病预防与医学研究具有重要意义。


   体检报告识别可以帮助医务服务人员自动识别录入用户征信信息,节约人力成本、提升服务效率,实现降本增效,具有重要实际意义。基于PaddleOCR已在文字识别领域取得优秀成果,本项目基于PaddleOCR实现体检报告检测与识别,对数据进行结构化处理,结合CV+NLP技术达到一定识别精度,未来推广应用场景可以基于识别信息做个性化疾病预测与健康推荐。


二、项目链接

PaddleOCR体检报告识别 - 飞桨AI Studio


三、项目流程

PaddleOCR是百度开源的超轻量级OCR模型库,本文使用其框架进行体检报告识别,本次项目具体流程包括:


PaddleOCR环境安装与快速预测

体检报告检测模型训练det

体检报告识别模型训练rec


四、技术介绍

针对PaddleOCR提供的算法模型,本次选择基础模型用于体检报告识别与检测,流程如下:

image.png


1.检测:DB算法

image.png


文字检测参考这篇:

OCR文字识别技术总结(三)__文本检测算法总结


2.识别:CRNN+CTC

CRNN可参考这篇文章:

CRNN文字识别_GoAI的博客-CSDN博客_crnn


目录
打赏
0
0
0
0
521
分享
相关文章
威胁检测与分析--云图大师
云图大师是一款专注于威胁检测与分析的工具,应对多种网络威胁,如计算机病毒、流氓安全软件、特洛伊木马、广告软件、间谍软件、蠕虫、DDoS攻击等。它利用云端数据收集系统和核心情报提取技术,提供高覆盖率和准确性的情报。云图核心功能包括内网威胁发现、SOC/SIEM系统能力增强、公网访问IP风险识别、企业资产管理和安全事件关联分析。适用于日常运营、重大场景保障和实战化攻防演练,助力提升网络安全防护和应急响应能力。
阿里云安全体检功能评测报告
阿里云安全体检流程简介: 1. 登录官网并进入安全管控控制台。 2. 开启体检,预计30分钟完成。 3. 查看结果,包括攻击告警、风险漏洞等。 4. 修复问题并再次体检。 主要发现: - 安全组开放了高风险端口(22/3389),存在暴力破解风险。 - 主账号未开启MFA,增加被盗风险。 - 使用主账号AccessKey,权限过大且不可缩小。 修复措施: - 调整安全组配置,限制IP访问。 - 开启MFA,增强账号安全性。 - 使用RAM用户AccessKey,做好权限控制。 总结:阿里云安全体检功能全面、专业,能有效发现和修复潜在安全风险,建议进一步提升定制化程度和自动化修复工具。
医学影像系统PACS源码,综合医学影像浏览、处理和诊断工作站
综合医学影像工作站,支持放射、超声等科室的DICOM标准数字影像,具备专业的影像增强处理功能,兼容PACS网络。系统特点包括全面支持DICOM标准,与各种医学成像设备连接,支持图像发送、打印及动态影像流式传输,并支持多显示器。系统功能涵盖多模态影像浏览、常规及高端影像处理、多种标注测量工具。此外,工作站还支持DICOM协议通讯、数据自动路由、光盘备份及不同图像格式输出。PACS系统基于国际标准构建,支持Windows/Linux平台,采用Oracle数据库,具备双机热备及RAID功能,确保图像质量与数据传输满足行业需求,且易于与现有HIS系统集成,支持远程DICOM传输,具有分级权限管理功能。
119 0
医学影像系统PACS源码,综合医学影像浏览、处理和诊断工作站
基于YOLOv8深度学习的危险区域人员闯入检测与报警系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、区域闯入
基于YOLOv8深度学习的危险区域人员闯入检测与报警系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、区域闯入
【Java】医院云HIS信息管理系统源码:实现检验、检查、心理CT、B超等医技报告查看
【Java】医院云HIS信息管理系统源码:实现检验、检查、心理CT、B超等医技报告查看
158 0
【网安AIGC专题10.19】5 ChatRepair:ChatGPT+漏洞定位+补丁生成+补丁验证+APR方法+ChatRepair+不同修复场景+修复效果(韦恩图展示)
【网安AIGC专题10.19】5 ChatRepair:ChatGPT+漏洞定位+补丁生成+补丁验证+APR方法+ChatRepair+不同修复场景+修复效果(韦恩图展示)
298 0
核酸结果统计难?130行代码实现基于ocr的核酸截图识别存储Excel(复现代码核查核酸报告)
核酸结果统计难?130行代码实现基于ocr的核酸截图识别存储Excel(复现代码核查核酸报告)
160 0
C++编程医院医学影像系统PACS,包含使用手册和CT操作说明书
首先,PACS系统可实现三维重建、检查预约、病人信息登记、计算机阅片、电子报告书写、胶片打印、数据备份等一系列满足影像科室日常工作的功能,并且由于影像数字化存储,用户可利用影像处理与测量技术辅助诊断、方便快捷地查找资料或利用网络将资料传输至临床科室,还可与医院HIS、LIS无缝连接。
292 0