1月中旬,央行征信中心启动了二代征信系统切换上线工作,开始面向社会公众和金融机构开放二代格式信用报告查询服务。随后,深源恒际及时跟进信用报告OCR识别产品的升级工作。目前产品迭代已完成,深源恒际将于本周内上线二代个人信用报告OCR识别服务。
信用报告OCR识别产品主要面向信贷服务机构,提供基于个人信用报告的信息自动化识别与提取服务。基于OCR识别技术结合专项训练方法构建的信用报告识别专用模型,自动识别、提取个人信用报告上的文本信息,并进行结构化输出,帮助信贷机构高效提取、采录用户信用信息,为信贷决策提供重要参考。
随着国内市场经济的深入发展,各种经济活动的信用关系越来越复杂,建立和完善征信体系成为信用经济正常运转的必要条件。在我国,央行征信中心作为专门的第三方征信服务机构,为个人或企业建立“信用档案”(个人信用报告/企业信用报告),为商业银行及其他专业化授信机构提供信用信息共享,有效降低交易过程各参与方之间的信息不对称,以及信息不对称带来的交易风险。
其中,被称为“经济身份证”的个人信用报告,在个体信贷服务中扮演着重要角色。当信贷机构对外提供授信服务时,基于个人信用报告了解用户既往的信用行为和资信状况,可以为贷前风险评估和放贷决策提供有力参考,进而有效防范信用风险、保障交易安全。
在实际业务操作层面,信贷机构通常经由用户授权后从央行征信中心查询、下载、打印其个人信用报告,再由人工完成报告信息的逐项填报与录入,以便风控系统分析、评估潜在的交易风险。然而,一份个人信用报告涵盖的信息量庞大,尤其征信系统优化升级后,信息量更加丰富,依托人工录入耗时且费力,难免影响放贷审批效率,造成意向客户的流失;或者,为实现快速放款,人工处理信息时删繁就简,容易因疏漏导致风险评估失准。
深源恒际信用报告OCR识别服务以自动化方式帮助信贷审核人员快速提取、采录用户信用信息,高效完成信用分析与评估。二代征信系统上线后,深源恒际团队从模板更新和图像降噪两方面着手优化算法模型,完成相应的配套升级。
据悉,二代征信系统在信息采集、产品加工、技术架构和安全防护四方面进行了优化改进,与一代系统相比,二代征信系统提供的信用报告优化丰富了基本信息和信贷信息内容,改进了报告生成机制和展示形式,提升了信息更新效率。针对上述变化,深源恒际团队从两方面对算法模型进行优化:一是基于二代信用报告格式,强化特征提取细粒度,更新识别模板,提升模型的识别稳定性;二是提升抗干扰能力,基于直线/表格线识别规则纠正文本畸变,结合启发式规则实现翻页文本合并,提高模型的识别准确率。
升级完成后,基于OCR完成单份个人信用报告的提取与录入用时仅为20s-30s;相较人工作业耗时,信息采录效率显著提升。事实上,借力专业化、自动化的信用信息提取服务,信贷服务的交易时间将大幅缩短,有助于信贷服务更加高效、便捷地触达用户,加快推进普惠金融发展进程。