从数据治理看医疗大数据的发展

简介: 云栖TechDay活动第二十三期中,宏优信息技术(上海)有限公司王珏总经理带来了题为《从数据治理看医疗大数据的发展》的分享,他主要与大家分享医疗大数据中数据治理的重要性,并结合具体案例来讲述大数据治理的框架和应用心得。
摘要:云栖TechDay活动第二十三期中,宏优信息技术(上海)有限公司王珏总经理带来了题为《从数据治理看医疗大数据的发展》的分享,他主要与大家分享医疗大数据中数据治理的重要性,并结合具体案例来讲述大数据治理的框架和应用心得。

当前IT现在最头痛的事情之一。就是业务系统显烟囱式,大多在是10到30个之间,那么很明显,医疗信息共享是一个很大的挑战。
aa627c84a6eb6a0a2857f180b7350075d96f1766
采用医疗大数据来促动医疗信息化发展和医疗管理精细化,第一点是改善患者的就医体验。大家知道为什么阿里巴巴这么受欢迎,你们为什么上淘宝,就是因为购物体验是相当好的。
2fc87ae575a0bb5164d77c9752911edd11a3e49a
今天医疗行业面临最大的挑战(政府都差不多),就是怎么消除数据孤岛。如何通过数据流实现业务流程的优化,去合理规划医疗资源的利用。今天上海市要求二级医院的医生给患者看病不能低于8分钟,但是医生有没有这个耐心的,多花时间与患者交流,这个跟他的绩效考核有关系。那么绩效指标基于什么,基于大数据自然会更科学。
a5504ca159034c6b6b9a451f08c70ed0faa086dd
医疗大数据的治理跟流程有关。首先,数据怎么采集进来;第二,数据怎么治理,弄清楚元数据,主数据和数据质量。
ec5579f79404dd9140034ed8b6014caf97e65c20

以往数据采集有一个很大的问题就是要经过ETL的转化。大家知道增加一个节点就是增加一个噪音,增加噪音就会衰减很多,也会丢很多数据,这就是传统的数据仓库技术正逐步被大数据分析技术替代的原因之一。大数据技术的优点之一,就是可以将源数据全部拿过来,就像韩信点兵一样,多多益善。再通过大数据治理,提高数据质量,为下一步数据处理或开放提供基础。

df8467d8257eff7b98209c13594b90d189cdd7ae

大数据不仅包括传统数据库里的海量结构化数据,更包含以往的内容管理(即针对非结构数据,如视频、音频、文本、图像和图形),须做内容的全生命周期管理,这要有一个很重要的流程:怎么做获取,怎么做分类,怎么做处理,怎么做保存。像电子病历、电子健康档案,从你出生那天开始就应该有,也包括父母的,涉及很多遗传病。

84fda8608b77654b25dd6b9c1140ee06b724134b8552250c183fb62f91e6fd5f5cf4b72ea919ee76

再谈谈治理、风控与合规对数据质量的影响。它们可提高数据质量,确保信息的准确性和价值,从而为机构提供可靠和可信的数据。


  • 治理Governance:这包括管理和确保企业数据的可用性、可访问性、质量、一致性、可审计性和安全性所需的流程、政策、标准、结构及技术。测量和监控,以持续证明数据得到保护。
  • 风险管理Risk Management: 风险管理是在机构中部署的协调性活动,用以降低事件的负面影响;如进行敏感数据的定义和分类(如 艾滋);
  • 合规性Compliance:遵守外部法律法规和公司政策与流程的行为以及相关证明。合规性管理是指遵守内部和外部强制性法律法规所需的协调性活动,如HIPPA。数据脱敏,以符合各种合规性标准。
机构比以往任何时候更需要可信赖且高质量的数据,以满足业务治理、风险管理和合规性的需求。机构发现低质量数据会严重影响其支持业务流程、遵守行业法规和作出正确决策的能力,为此,必须通过一系列信息管理计划提高数据质量活动的可见性。

最后,介绍一下在这方面的应用实践。我们做的一个应用实践是来自于一个框架,这个框架在国外是相对比较流行的。第一个是在数据采集和治理应该是混合在一起,第二个在国外做信息化的时候一定有管理工具配套指导的。因为中国从1977年开始高速发展了40年,但整个来讲是比较粗放型的,粗放型带来的副效应是对管理和技术的应用要求并不是太高。那么因为高速的发展也让我们人认为我们管理是非常好的,但目前的新常态语境下的产业升级对技术和管理有更高的要求和需求。第三个就是在机构做大数据应用,必须与业务流程整合,全面预算就是典型的案例。
c26c3df6889769de2d3f79fe4da19a2cf2f2e185
细节是魔鬼,所以要做精细化一定要关注细节,这也是大数据的强项。刚才讲了管理工具,我们在整个医疗机构引入了平衡计分卡,平衡计分卡在中国医疗行业用的比较少,在国外是比较流行的,发达国家80%医疗机构均利用平衡计分卡做战略管理工具或绩效管理,所以他们互相交流是有一种共性的。平衡计分卡从四个层面来监控机构的整个战略实施:运营层面、患者层面、财务层面和学习成长层面。平衡计分卡还需有一个支撑,知识管理。在整个服务性行业,知识管理是非常重要的,因为要做到知识共享。平衡计分卡最大的好处是平衡计分卡和战略协调结合在一起,最大的特点是衡量你的无形资产。
3fe1a18770f825e9ebd33ee58764005a8d36c65e
最后讲一点全面预算。因为中国的企业基本上做全面预算都是基于ERP的,所以企业整个预算是比较规范。中国的政府包括医院做全面预算是基于特定应用的,做预算的时候,每次讨论问题的时候他们都很不是思路很清晰,其根本原因,就是没有数据依据。做预算的时候,首先编制的参考依据就是文档(合规的表现),基于参考依据在把考核数据放进去,扯皮的时间少,明显可加快预算的速度。前面提到大数据要与业务流程结合,这是一个基本原则,所以我们讲大数据一直强调的是流程。
6f66a2f9e30c8ef4ae15db9c577bcf9b3fa41cd3

最后小结一下,如果大数据不能够覆盖全面业务的话,那依然是头痛治头,脚痛治脚。肯定要基于一个管理体系,去整合所有业务。最重要一点,就是大数据最大的目的,是要把想法变成规划,然后把规划变成决策。决策就形成行动。

2c76b826995fa60403b9af13a298d4af7e970952

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
7月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
482 14
|
6月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
7月前
|
传感器 人工智能 监控
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
235 14
|
7月前
|
机器学习/深度学习 传感器 监控
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
230 1
|
6月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
510 0
|
7月前
|
数据采集 自动驾驶 机器人
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
634 1
|
8月前
|
机器学习/深度学习 监控 大数据
数据当“安全带”:金融市场如何用大数据玩转风险控制?
数据当“安全带”:金融市场如何用大数据玩转风险控制?
343 10
|
9月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
320 4
|
9月前
|
分布式计算 DataWorks 数据处理
在数据浪潮中前行:记录一次我与ODPS的实践、思考与展望
本文详细介绍了在 AI 时代背景下,如何利用阿里云 ODPS 平台(尤其是 MaxCompute)进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向,同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径,为企业提供高效、低成本的大规模数据处理方案。
424 3
|
9月前
|
SQL 人工智能 分布式计算
ODPS:数据浪潮中的成长与突围
本文讲述了作者在大数据浪潮中,通过引入阿里云ODPS体系(包括MaxCompute、DataWorks、Hologres)解决数据处理瓶颈、实现业务突破与个人成长的故事。从被海量数据困扰到构建“离线+实时”数据架构,ODPS不仅提升了数据处理效率,更推动了技术能力与业务影响力的双重跃迁。