星熠案例:基于“隐语”多方安全分析的智能化理赔

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 星熠案例:基于“隐语”多方安全分析的智能化理赔


以下文章来源于数据安全共同体计划,作者DSC共同体

一、行业应用背景随着大数据人工智能等技术的发展,推动健康险迈入3.0时代,保险行业数字化转型中服务逐步实现向线上迁移,数据合规使用为保险理赔模式优化带来无限可能。其中,商业健康险作为促进多层次医疗保障体系建设的重要组成部分,对于国民医疗健康具有重要意义。2022年1月,中国银保监会人身险部向全国各人身保险公司下发《关于印发商业健康保险发展问题和建议报告的通知》:“争取与医疗机构信息系统实现充分信息共享,改进结算服务;在确保信息安全和个人隐私权的基础上,强化医疗健康大数据运用,推动医疗支付方式改革,更好服务医保政策制定和医疗费用管理。”面对理赔业务升级需求以及监管的要求,保险公司在服务创新的过程中需要优先重视数据合规,因而隐私计算就提供了这种中立可信的技术支撑。为了解决千万级在保用户住院医疗险的理赔体验、成本和效能问题,蚂蚁保险科技团队与保险公司合作,构建了基于理赔科技平台和隐私计算框架“隐语”的“理赔大脑”智能理赔系统。

二、案例整体介绍

系统基于住院医疗险理赔凭证图像的机器学习,借助数据优势(数十万级典型理赔案件)并辅以一定的知识约束,实现了视觉识别+文本分类+文本语义理解的多模态医疗凭证识别模型(对100+种医疗理赔凭证的识别准确率达到95%以上),突破了真正可以大规模商业化应用的医疗凭证深度结构化“专家级”高置信辅助核赔决策能力,帮助保险机构理赔效能提升70%以上。系统基于“隐语”框架的大范围线上数据化合作调查能力,又进一步减少了保险公司线下调查的成本和时长花费,将医疗事实调查的数字化和智能化应用,推进到了一个新的高度。关于本案例,出品了视频讲解课程,欢迎家扫码观看。


三、隐私计算在本案例的应用为了有效发现阳性线索,降低错赔风险。需要合规使用外部医疗数据,充分发挥其价值。现有MPC技术适用于多方联合建模(如联合风控场景),但不适合策略驱动、强规则计算的理赔阳性风险发现场景。在整个系统中,健康险定制多方数据联合分析解决方案是核心模块之一。本项目基于“隐语”提供的MPC SQL多方联合分析领域专用语言,构建了健康险定制多方数据联合分析解决方案,覆盖了全国案件占比50%省份的官方合法来源医疗数据,为医疗数据的合规使用提供了一种典型案例。这一方案基于多方安全计算技术,使用安全加密算法将多方数据进行联合分析。帮助保险公司及其外部医疗数据ISV在原始数据不离开本地、数据价值有保护的前提下,进行联合分析。在最大程度保障用户隐私的基础上,满足了业务需要。
四、多方联合分析过程蚂蚁保与保险公司基于“隐语”框架的多方联合分析能力,在保障联合项目各参与方数据隐私前提下,引入外部数据源完成联合分析的流程如下:

  • 节点部署

用户一键获取部署包,填入节点标识&token信息后执行脚本,即可轻量化、小时内完成本地节点部署;

  • 数据准备(进行前置安全配置)

双方分别将各自的样本数据,加载至各自本地分析节点,并在平台上注册对应样本的数据表结构,同意授权进入多方安全分析项目。

  • 规则开发

基于隐语的丰富MPC SQL算子支持,用户可以在脚本中描述基于多个数据源的安全计算,通过“SELECT FROM”、“JOIN ON”、“GROUP BY”等语句的组合搭配,即可完成联合分析的统计结果生成;通过“SELECT INTO”语句可将交集结果导出至节点本地。

  • 规则部署

随后,用户可使用ISV授权的数据,通过联合分析提供的在线SCQLIDE,在平台完成在线调试优化规则,且经调试验证后的规则可作为标准规则在更多数据源进行规模化部署。

  • 调用规则

规则部署完成后,用户在平台端即可对规则发起调用,且隐语支持简单的数据分析结果可视,如就诊分布、就诊频次等分析结果。

  • 数据源拓展

用户还可通过持续引入外部医疗数据进一步提升丰富底层数据能力,进一步提升自身理赔和风控能力,增加核保场景智能决策服务。


五、案例隐私计算技术突破

  • 前置数据安全配置 数据资源分级分类

在数据准备环节中,用户可通过隐语的CCL前置安全配置功能,在MPC相关技术能力支撑下,对数据资产进行分级分类,通过前置配置来保证安全级别高的数据的安全性,保证多方隐私数据在计算过程中不泄漏。

  • 丰富MPC SQL算子支持 编写脚本描述基于多个数据源的安全计算

隐语支持:算术计算(+, -, *, /, %)、比较(>, <, >=, <=, =, <>, IN, NOT IN)、逻辑计算(AND, OR, NOT)、窗口聚合(group by ... min, max, avg, sum, count, median )、控制(IF, CASE WHEN)、排序(RANK, ROW NUMBER, ORDER BY)、日期函数(DATE_DIFF, DATE_ADD)、其他函数(ceil, floor, round...)丰富算子。

  • 底层数据能力持续丰富能力

在如上隐语框架分层总览图所示,隐语在资源管理层面向业务交付团队,可以屏蔽不同机构底层基础设施的差异,降低业务交付团队的部署运维成本。另一方面,可以对联合项目中的节点、数据、成员核心资源进行集中式管理,构建出一个高效协作的数据协同网络。

  • 隐私计算与多种技术的结合探索

在整个智能理赔系统中,隐语框架聚焦于合规引入ISV的医疗数据,在数据用于分析、机器学习的过程中则更涉及就医凭证多模态分类识别、医疗文本NLP深度学习引擎等技术,是隐私计算与其他技术综合应用的典型探索,对图像、文本等更多类型的数据价值协同挖掘利用具有范式效应。


六、案例业务成效基于隐语MPC SQL多方联合分析领域专用语言的健康险定制多方数据联合分析解决方案,有利于提升阳性案件识别和调查路径规划能力,覆盖了全国案件占比50%省份的官方合法来源医疗数据,为医疗数据的合规使用提供了一种典型案例。利于有效发现阳性线索、降低错赔风险,通过数字化调查审核控制了理赔运营成本,更有利于扩大普惠医疗的服务范围、提升普惠医疗的服务效率。“理赔大脑”智能理赔系统上线后,整体相对于传统线下调查作业,调查案均成本降低了40%,赔付率控制在了合理水平,保障了业务持续健康发展。


七、案例推广展望此次健康险定制多方数据联合分析解决方案的落地不仅有利于商业健康险的降本增效良好发展,更可拓展应用于医疗行业中的前沿技术合作、创新药研发、高端医疗器械研发应用以及疾病风险评估、疾病预防、分类诊断等众多场景,联通多种类型的医疗健康数据。在我国,健康医疗大数据作为国家重要基础性战略资源在管理决策、公共卫生、临床科研、惠民服务、行业治理和产业发展等众多方面影响深远。医疗健康大数据生态的构建,有利于平衡医疗资源本身在地域分布上的差异,促进社会资源的合理分配,提升国民健康服务的整体水平。| 本文由蚂蚁集团供稿

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
相关文章
|
3月前
|
物联网 大数据 BI
助力工业物联网,工业大数据之客户回访事实指标需求分析【二十三】
助力工业物联网,工业大数据之客户回访事实指标需求分析【二十三】
46 0
|
存储 机器学习/深度学习 分布式计算
当金融风控遇上人工智能,众安金融的实时特征平台实践
随着企业数字化转型升级,线上业务呈现多场景、多渠道、多元化的特征。数据要素价值的挖掘可谓分秒必争,业务也对数据的时效性和灵活性提出了更高的要求。在庞大分散、高并发的数据来源背景下,数据的实时处理能力成为企业提升竞争力的一大因素。今天分享的是众安金融实时特征平台实践。
384 0
当金融风控遇上人工智能,众安金融的实时特征平台实践
|
安全 网络安全 数据安全/隐私保护
「数安周享会」隐语开源社区:隐私计算助力数据要素市场化-难而正确的事情
「数安周享会」隐语开源社区:隐私计算助力数据要素市场化-难而正确的事情
|
机器学习/深度学习 人工智能 监控
作为超级自动化的重要先驱,流程挖掘正在成为组织运营标配
国产RPA厂商首次入选顶级行业报告,国内外流程挖掘玩家都有谁?流程挖掘有什么价值?一文看明白。
142 0
|
机器学习/深度学习 人工智能 运维
客户分享:智能风控 未来已来|学习笔记
快速学习客户分享:智能风控 未来已来。
230 0
客户分享:智能风控 未来已来|学习笔记
|
机器学习/深度学习 算法 搜索推荐
大数据时代,如何构建精准用户画像,直击精细化运营
移动互联网时代,精细化运营逐渐成为企业发展的重要竞争力,“用户画像”的概念也应运而生。用户画像是指,在大数据时代,企业通过对海量数据信息进行清洗、聚类、分析,将数据抽象成标签,再利用这些标签将用户形象具体化的过程。
2388 0
|
机器学习/深度学习 数据采集 SQL
关于互联网金融授信产品的风控建模
关于互联网金融授信产品的风控建模
关于互联网金融授信产品的风控建模
|
数据采集 数据可视化
智慧公安情报研判分析系统开发,合成作战平台建设
智慧公安情报研判分析系统是集基础信息采集、情报信息研判、数据查询、从底层数据采集到高端研判应用自上至下贯穿整个公安局情报信息化业务。实现了情报信息即时研判。进一步实现了情报导警务。建立健全情报信息收集、研判机制,形成全警采集、全警录入、专人管理的情报工作格局,大限度地扩充情报信息资源。实行分层分级研判。
314 0
|
大数据
合成作战平台建设解决方案,公安情报研发系统开发
合成作战解决方案以公安信息化系统和大数据为基础,以合成作战平台为核心,依托合成作战中心,形成情报、研判、侦查、指挥、行动一体化的多警种合成作战模式,解决现有背景下数据、情报共享、多警种多部门警务合作、技战法升级更新等问题,从工作流程、实战效能、空间设计等多维度全方位打造服务实战的一体化合成作战解决方案。
423 0
|
监控 大数据 物联网
重点人员管控系统开发,大数据合成作战平台建设
重点人员管控系统,大数据合成研判平台架构通过“物联网”技术进行身份、车牌、人脸、手机、指纹和声音等信息录入采集,传输至平台,并与公安己有数据资源对接,进行大数据深层挖掘和智能研判应用,不仅可以对人员、车辆、事件等实时监控报警,还可以对比进行分析研判合成,从而做到提前布控和精准拦截,为公安人员提供有力的数据支撑。
188 0