星熠案例:基于“隐语”多方安全分析的智能化理赔

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 星熠案例:基于“隐语”多方安全分析的智能化理赔


以下文章来源于数据安全共同体计划,作者DSC共同体

一、行业应用背景随着大数据人工智能等技术的发展,推动健康险迈入3.0时代,保险行业数字化转型中服务逐步实现向线上迁移,数据合规使用为保险理赔模式优化带来无限可能。其中,商业健康险作为促进多层次医疗保障体系建设的重要组成部分,对于国民医疗健康具有重要意义。2022年1月,中国银保监会人身险部向全国各人身保险公司下发《关于印发商业健康保险发展问题和建议报告的通知》:“争取与医疗机构信息系统实现充分信息共享,改进结算服务;在确保信息安全和个人隐私权的基础上,强化医疗健康大数据运用,推动医疗支付方式改革,更好服务医保政策制定和医疗费用管理。”面对理赔业务升级需求以及监管的要求,保险公司在服务创新的过程中需要优先重视数据合规,因而隐私计算就提供了这种中立可信的技术支撑。为了解决千万级在保用户住院医疗险的理赔体验、成本和效能问题,蚂蚁保险科技团队与保险公司合作,构建了基于理赔科技平台和隐私计算框架“隐语”的“理赔大脑”智能理赔系统。

二、案例整体介绍

系统基于住院医疗险理赔凭证图像的机器学习,借助数据优势(数十万级典型理赔案件)并辅以一定的知识约束,实现了视觉识别+文本分类+文本语义理解的多模态医疗凭证识别模型(对100+种医疗理赔凭证的识别准确率达到95%以上),突破了真正可以大规模商业化应用的医疗凭证深度结构化“专家级”高置信辅助核赔决策能力,帮助保险机构理赔效能提升70%以上。系统基于“隐语”框架的大范围线上数据化合作调查能力,又进一步减少了保险公司线下调查的成本和时长花费,将医疗事实调查的数字化和智能化应用,推进到了一个新的高度。关于本案例,出品了视频讲解课程,欢迎家扫码观看。


三、隐私计算在本案例的应用为了有效发现阳性线索,降低错赔风险。需要合规使用外部医疗数据,充分发挥其价值。现有MPC技术适用于多方联合建模(如联合风控场景),但不适合策略驱动、强规则计算的理赔阳性风险发现场景。在整个系统中,健康险定制多方数据联合分析解决方案是核心模块之一。本项目基于“隐语”提供的MPC SQL多方联合分析领域专用语言,构建了健康险定制多方数据联合分析解决方案,覆盖了全国案件占比50%省份的官方合法来源医疗数据,为医疗数据的合规使用提供了一种典型案例。这一方案基于多方安全计算技术,使用安全加密算法将多方数据进行联合分析。帮助保险公司及其外部医疗数据ISV在原始数据不离开本地、数据价值有保护的前提下,进行联合分析。在最大程度保障用户隐私的基础上,满足了业务需要。
四、多方联合分析过程蚂蚁保与保险公司基于“隐语”框架的多方联合分析能力,在保障联合项目各参与方数据隐私前提下,引入外部数据源完成联合分析的流程如下:

  • 节点部署

用户一键获取部署包,填入节点标识&token信息后执行脚本,即可轻量化、小时内完成本地节点部署;

  • 数据准备(进行前置安全配置)

双方分别将各自的样本数据,加载至各自本地分析节点,并在平台上注册对应样本的数据表结构,同意授权进入多方安全分析项目。

  • 规则开发

基于隐语的丰富MPC SQL算子支持,用户可以在脚本中描述基于多个数据源的安全计算,通过“SELECT FROM”、“JOIN ON”、“GROUP BY”等语句的组合搭配,即可完成联合分析的统计结果生成;通过“SELECT INTO”语句可将交集结果导出至节点本地。

  • 规则部署

随后,用户可使用ISV授权的数据,通过联合分析提供的在线SCQLIDE,在平台完成在线调试优化规则,且经调试验证后的规则可作为标准规则在更多数据源进行规模化部署。

  • 调用规则

规则部署完成后,用户在平台端即可对规则发起调用,且隐语支持简单的数据分析结果可视,如就诊分布、就诊频次等分析结果。

  • 数据源拓展

用户还可通过持续引入外部医疗数据进一步提升丰富底层数据能力,进一步提升自身理赔和风控能力,增加核保场景智能决策服务。


五、案例隐私计算技术突破

  • 前置数据安全配置 数据资源分级分类

在数据准备环节中,用户可通过隐语的CCL前置安全配置功能,在MPC相关技术能力支撑下,对数据资产进行分级分类,通过前置配置来保证安全级别高的数据的安全性,保证多方隐私数据在计算过程中不泄漏。

  • 丰富MPC SQL算子支持 编写脚本描述基于多个数据源的安全计算

隐语支持:算术计算(+, -, *, /, %)、比较(>, <, >=, <=, =, <>, IN, NOT IN)、逻辑计算(AND, OR, NOT)、窗口聚合(group by ... min, max, avg, sum, count, median )、控制(IF, CASE WHEN)、排序(RANK, ROW NUMBER, ORDER BY)、日期函数(DATE_DIFF, DATE_ADD)、其他函数(ceil, floor, round...)丰富算子。

  • 底层数据能力持续丰富能力

在如上隐语框架分层总览图所示,隐语在资源管理层面向业务交付团队,可以屏蔽不同机构底层基础设施的差异,降低业务交付团队的部署运维成本。另一方面,可以对联合项目中的节点、数据、成员核心资源进行集中式管理,构建出一个高效协作的数据协同网络。

  • 隐私计算与多种技术的结合探索

在整个智能理赔系统中,隐语框架聚焦于合规引入ISV的医疗数据,在数据用于分析、机器学习的过程中则更涉及就医凭证多模态分类识别、医疗文本NLP深度学习引擎等技术,是隐私计算与其他技术综合应用的典型探索,对图像、文本等更多类型的数据价值协同挖掘利用具有范式效应。


六、案例业务成效基于隐语MPC SQL多方联合分析领域专用语言的健康险定制多方数据联合分析解决方案,有利于提升阳性案件识别和调查路径规划能力,覆盖了全国案件占比50%省份的官方合法来源医疗数据,为医疗数据的合规使用提供了一种典型案例。利于有效发现阳性线索、降低错赔风险,通过数字化调查审核控制了理赔运营成本,更有利于扩大普惠医疗的服务范围、提升普惠医疗的服务效率。“理赔大脑”智能理赔系统上线后,整体相对于传统线下调查作业,调查案均成本降低了40%,赔付率控制在了合理水平,保障了业务持续健康发展。


七、案例推广展望此次健康险定制多方数据联合分析解决方案的落地不仅有利于商业健康险的降本增效良好发展,更可拓展应用于医疗行业中的前沿技术合作、创新药研发、高端医疗器械研发应用以及疾病风险评估、疾病预防、分类诊断等众多场景,联通多种类型的医疗健康数据。在我国,健康医疗大数据作为国家重要基础性战略资源在管理决策、公共卫生、临床科研、惠民服务、行业治理和产业发展等众多方面影响深远。医疗健康大数据生态的构建,有利于平衡医疗资源本身在地域分布上的差异,促进社会资源的合理分配,提升国民健康服务的整体水平。| 本文由蚂蚁集团供稿

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
相关文章
|
9天前
|
机器学习/深度学习 自然语言处理 监控
金融行业的大数据风控模型:构建安全高效的信用评估体系
金融机构借助大数据风控提升信贷效率,通过数据收集、清洗、特征工程、模型构建与评估来识别风险。关键技术涉及机器学习、深度学习、NLP和实时处理。以下是一个Python风控模型构建的简例,展示了从数据预处理到模型训练、评估的过程,并提及实时监控预警的重要性。该文旨在阐述大数据风控的核心要素和关键技术,并提供基础的代码实现概念。【6月更文挑战第23天】
52 8
|
2月前
|
存储 安全 数据安全/隐私保护
隐语实训营-第2讲:隐私计算开源助力数据要素流通
数据要素大潮带来了全新的数据安全外循环技术挑战,即信任焦虑,需要从主体信任逐渐转向技术信任。面对这些挑战,隐私计算需要不断丰富其内涵,不断标准化其产品能力的度量尺度,不断降低接入门槛。而开源隐语具有技术优势和专业的安全验证,获得过多项权威认定和荣誉,极大地推动了行业标准化及生态建设。
58 1
|
2月前
|
物联网 大数据 BI
助力工业物联网,工业大数据之客户回访事实指标需求分析【二十三】
助力工业物联网,工业大数据之客户回访事实指标需求分析【二十三】
37 0
|
数据采集 存储 监控
谈谈医疗行业数据治理的四个关键阶段【后附医院数据治理案例】
数据是推动医疗行业的改进,驾驭不断变化的医疗行业环境的必要资源。它使医疗行业组织能够评估医疗的提供和支持方式、患者参与和教育的方式,以及支付者和提供者如何共同努力提高价值。
谈谈医疗行业数据治理的四个关键阶段【后附医院数据治理案例】
|
机器学习/深度学习 人工智能 运维
客户分享:智能风控 未来已来|学习笔记
快速学习客户分享:智能风控 未来已来。
217 0
客户分享:智能风控 未来已来|学习笔记
|
大数据
合成作战平台建设解决方案,公安情报研发系统开发
合成作战解决方案以公安信息化系统和大数据为基础,以合成作战平台为核心,依托合成作战中心,形成情报、研判、侦查、指挥、行动一体化的多警种合成作战模式,解决现有背景下数据、情报共享、多警种多部门警务合作、技战法升级更新等问题,从工作流程、实战效能、空间设计等多维度全方位打造服务实战的一体化合成作战解决方案。
397 0
|
监控 大数据 物联网
重点人员管控系统开发,大数据合成作战平台建设
重点人员管控系统,大数据合成研判平台架构通过“物联网”技术进行身份、车牌、人脸、手机、指纹和声音等信息录入采集,传输至平台,并与公安己有数据资源对接,进行大数据深层挖掘和智能研判应用,不仅可以对人员、车辆、事件等实时监控报警,还可以对比进行分析研判合成,从而做到提前布控和精准拦截,为公安人员提供有力的数据支撑。
180 0
|
大数据 云计算 计算机视觉
大数据合成作战指挥平台建设,情指勤一体化管控系统开发
合成作战平台依托现代化科技手段,包括云计算、大数据、人脸识别、车辆识别、视频结构化等新技术,建立一个多警种共同使用的合成作战平台,为打击侦查、联合办案、合成作战增添有力的利器,从而提升了公安办案效率和增强办案效力。
204 0
|
数据可视化 大数据 调度
公安合成作战系统开发方案,大数据可视化分析平台建设
公安合成作战是指多个警种在统一的组织指挥下,为执行某项特定的任务,发挥各自的特长和优势,组合成为一个新的整体而进行的一种作战模式,该模式可实现信息的快速收集、分析、共享、流转及相关业务的综合应用,发挥各警种合成的整体效能,可在有限警力条件下实现快速反应、精确打击。
196 0
|
数据采集 BI
智慧公安情报研判分析系统开发,大数据分析平台建设
智慧公安情报研判分析系统是集基础信息采集、情报信息研判、数据查询、从底层数据采集到高端研判应用自上至下贯穿整个公安局情报信息化业务。
511 0