深源恒际医疗票据OCR落地九省市 服务范围覆盖过半市场

本文涉及的产品
企业资质识别,企业资质识别 200次/月
OCR统一识别,每月200次
通用文字识别,通用文字识别 200次/月
简介: 保险科技公司深源恒际从健康险核赔理算业务场景入手,研发了医疗票据OCR产品,基于深度学习算法下的专项模型训练,自动识别、提取医疗票据上的核心理算信息,并将结构化的信息录入理算系统,旨在通过计算机视觉替代人力作业,大幅降低人力投入、缩短业务耗时,帮助健康险提升理赔服务效率、优化理赔服务体验。

近年来,我国健康险市场规模持续保持高增长。银保监会最新统计数据显示,2019年中国健康险业务原保险保费收入6564亿元,同比增长29.75%。同时,随着民众风险保障意识的不断提升,未来健康险仍有巨大的潜在增长空间。据天风证券研报预测,未来五年内健康险复合增速将保持在20%左右。

与市场规模呈正相关,健康险理赔案件数也在逐年走高。据了解,自2015年起,健康险理赔案件数量和赔付金额正以年均20%的速度增长。因此,如何提升服务效率、优化服务体验,成为保险机构增强市场竞争力的重要抓手。

保险科技公司深源恒际从健康险核赔理算业务场景入手,研发了医疗票据OCR产品,基于深度学习算法下的专项模型训练,自动识别、提取医疗票据上的核心理算信息,并将结构化的信息录入理算系统,旨在通过计算机视觉替代人力作业,大幅降低人力投入、缩短业务耗时,帮助健康险提升理赔服务效率、优化理赔服务体验。

截至目前,该产品已先后在北京、天津、上海、广东、浙江、江苏、山东、河南及河北九省市完成落地,预估服务范围覆盖健康险过半市场。

01
切中要害 直击痛点

出于行业监管因素,目前商业医保机构无法直接获取或即时共享到投保用户的医疗信息。在涉及健康险理赔时,理算人员需要从用户提交的医疗单据上获取原始的理算数据,并将相关信息逐项录入系统,通常单个案件涉及录入的信息多达百余项。而人工录入的作业方式不够经济,一方面人工作业难免出现错漏,影响理算准确性,容易造成理赔渗漏,另一方面配置大量人力资源从事高度重复的事务性工作,耗时费力、效率低下。

深源恒际基于OCR识别技术,开发了集识别、提取、结构化功能于一体的信息识别录入自动化解决方案。在健康险核赔理算中,自动从各类医疗票据图像中识别、提取出理算所需的字段信息,并同步完成结构化录入,大幅缩短信息处理耗时,减少八成以上人力投入,使理赔效率整体提升60%-80%。同时,医疗票据OCR的应用,有助于健康险机构优化人力资源配置,基于流程自动化而释放的劳动力可参与从事对脑力依赖更强的工作。

目前,支持识别录入的票据类型包括门诊发票、住院发票、医保结算单、费用清单,字符识别准确率超过98%。

02
对症下药 攻破难点

事实上,医疗票据OCR在实际落地应用中面临诸多技术难点,如票面信息模糊、发票折叠畸变、内容重叠、信息串行等,均会对识别准确率形成干扰,给算法模型训练带来相应挑战。为降低、消弭噪音,深源恒际结合多种图像处理技术,在不损害文字信息的前提下排除干扰因素,让识别模型具备很好的抗干扰能力和鲁棒性。

image

首先,医疗票据在全国范围内没有统一的制版格式,各地版式差异明显。面对此类情形,通用OCR算法难以突破模版多样化的问题。深源恒际针对各地模版进行独立强化训练,在模型训练中增强特征提取细粒度,根据不同模版上的启发性信息辅助文字区域的定位和切分,弱化版式差异带来的不良影响。目前,已有包含北京、天津、上海、广东、浙江、江苏、山东、河南及河北九省市在内的票据模版完成针对性强化训练并发布上线。

其次,医疗票据多采用数据与格式分离的套打方式,在OCR识别中通常会带来两方面困扰:一是套打发票大多采用针式打印技术,图像分辨率低、打印字迹模糊,影响识别准确率;二是难免出现机打信息和印刷信息串行或内容重叠的情形,串行增加了信息提取难度,影响数据结构化;内容重叠造成部分信息被遮挡,在文本检测时容易导致漏检,在文本识别时容易导致误识。

深源恒际基于深度学习算法,通过图层分离技术解决了突破性地解决了套打票据识别中存在的技术难题,使识别准确率大幅提升。

图层分离:通过大量分析样本数据,提取机打部分与印刷部分的差异化特征,强化特征提取细粒度,基于深度学习方法搭建像素级图层分离模型,实现从原始图像中分离出机打信息与印刷信息,通过图层分离完成信息剥离。

坐标定位:图层分离后,基于图像识别技术获取所有文本条目的坐标信息,通过传统匹配算法完成印刷类文本条目坐标信息与机打类文本条目坐标信息的关联,实现印刷字段信息与机打字段信息的匹配,从而解决信息串行带来的干扰。

双识别模型:针对机打和印刷两类文本信息分别训练算法模型,大幅提升图层分离精确度,降低信息重叠带来的干扰。

再次,为确保理算信息完整无误,深源恒际提出“机器校验为主、人工复核为辅”的校验机制,开发了多重校验规则引擎。基于字段间的内在逻辑与关联关系,自动甄别置信度较低的字段信息,对存疑的高风险信息进行预警提示,并依据内在逻辑对可能出错的数据进行启发式纠正;对于模糊文字,则通过医疗词典库进行智能校验。综合多种方式辅助复核,快速完成数据的校验与纠正,为理算提供完整、精确的数据依据。

此外,医疗票据OCR服务与健康险理算中常用的智能理算规则引擎相衔接,可实现从信息录入到结果输出全面自动化,让健康险理赔真正驶入快车道。

未来,深源恒际将持续迭代算法模型,进一步扩大产品落地范围,在不间断的落地应用中优化产品性能,将技术创新优势延展到行业全流程中,打造全栈式智能服务。

相关文章
|
6月前
|
人工智能 安全 算法
中国在线反欺诈市场代表性厂商,瑞数信息再获IDC认可
IDC《AI助力下的中国在线反欺诈市场洞察(2024)》
中国在线反欺诈市场代表性厂商,瑞数信息再获IDC认可
|
数据采集 城市大脑 人工智能
全国首个跨省域智慧大脑上线!
全国首个跨省域智慧大脑上线!
110 0
|
Cloud Native 安全 小程序
云上故事 | 加速非税收缴和财政票据电子化改革 江苏省财政厅力推统一公共支付平台
为深化“放管服”改革,贯彻“互联网+政务服务”要求,江苏省财政厅加快推进江苏省统一公共支付平台建设,实现全省政府非税收入、政务服务在线收缴和财政电子票据的集中统一处理,不仅节约了因“重复建设”产生的财政支出,更极大提升了窗口服务效率和老百姓的幸福感。老百姓在缴纳教育费用、医疗费用、交通罚款等费用时都可以使用电子支付,并可开具财政电子票据。
1749 0
云上故事 | 加速非税收缴和财政票据电子化改革 江苏省财政厅力推统一公共支付平台
|
机器学习/深度学习 编解码 文字识别
深源恒际医疗票据OCR落地九省市 服务范围覆盖过半市场
保险科技公司深源恒际从健康险核赔理算业务场景入手,研发了医疗票据OCR产品,基于深度学习算法下的专项模型训练,自动识别、提取医疗票据上的核心理算信息,并将结构化的信息录入理算系统,旨在通过计算机视觉替代人力作业,大幅降低人力投入、缩短业务耗时,帮助健康险提升理赔服务效率、优化理赔服务体验。
深源恒际医疗票据OCR落地九省市 服务范围覆盖过半市场
|
人工智能 大数据
阿里云创新中心公布部分园区租金减免信息
阿里云创新中心携手创企共渡难关!
阿里云创新中心公布部分园区租金减免信息
|
机器学习/深度学习 边缘计算 算法
首次披露!阿里线下智能方案进化史
AI 技术已经从互联网走向零售、汽车、银行等传统行业。受限于延时、成本、安全等多方面的限制,单一的云解决方案往往不能满足场景需求。
1736 0
|
存储 安全 定位技术
16岁日本神童打造日版「健康码」,追踪用户行动数据抗击疫情
16岁日本计算机天才少年加藤(Kato)近日开发了一个使用GPS的行迹记录软件Asiato,可记录用户行踪,同时将数据储存在手机中,不会自动共享,一旦用户确定感染将锁定近几周去过的地方,方便寻找潜在的接触者。加藤5年级就开始编程,下一个目标是做北海道「美团」。
|
人工智能 监控 安全
方案 | 加快航企数字化转型 阿里云发布航空行业热度预测服务
阿里云结合航空行业情况积极推进航空行业疫情应对技术方案,从园区、机场、员工管理、办公协同、业务支持5个方面全面帮助航空企业应对疫情期间的业务开展场景以及应对后疫情时期的复工场景。
1677 0
|
安全 区块链
阿里云、蚂蚁区块链医疗解决方案首次应用于未来医院电子处方
4月8日,首届世界大健康博览会举行期间,阿里云宣布其联合支付宝共同研发的区块链医疗解决方案已经正式应用于武汉中心医院的电子处方,武汉市中心医院也成为首家应用该技术方案的“未来医院”。
5197 0