大数据中心在医院的落地,需如何去做集成融合与利用

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

大数据与AI时代的到来,近些年医院信息中心的工作人员非常关注一个问题:首先是医院有哪些数据应用已落地,其次是如果要想落地,医院信息中心应该怎么做融合和集成?

雷锋网了解到,通常情况下,医院信息系统应用可汇总为四大主线:服务患者系统、服务临床系统、服务医技系统、运营管理系统。

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

这四大主线可做很多数据量大、传输快、价值大、种类多的应用,这4个V于医院信息化而言,是完全是满足的。

医院信息系统面临的问题

虽然四大主线可以满足绝大部分医院信息化需求,但现阶段存在一些技术和管理漏点。

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

首先是耦合度很高,过往都是点对点进行对接,接口也比较多,数据不统一。

除此之外,大量数据都是字点分散,数据在各个业务系统里没有进行全面的整合与应用,导致效率低、标准差的问题。而从监控到文档管理,这两点可能都存在管理的漏点。

从全国乃至国际范围讲,医院对数据利用的需求也在不断高涨。

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

以北大第三医院为例,各部门和业务之间的协同、数据的互联互通、整体的数据挖掘应用,这么多底层系统到底该怎么做?

首先做个简单划分,小医院到大医院,从几十个系统到上百个系统,数量不一样,这些都已经初具规模。

那么如果规模超过上述标准,该怎么用、怎么做业务协同、数据利用、信息共享,这目前是信息部门的挑战和重点工作。

医院信息化的四个阶段

医院信息化可分为四个阶段:

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

第一个阶段就是管理信息化(HIS),北京大学第三医院1998年做HIS,而在一年后就做了CIS。这些都是以病人为中心,代表EMR电子病例为核心的临床信息化,为患者服务来提高医疗质量和患者的安全。

到了现在的第三阶段,院内信息化已经进入了院内信息交互的集中存储与数据中心利用,以它为核心的集成协同信息共享的平台化阶段。

再往上则是需要区域以及院际间的信息交互,数据区域共享平台。

医院信息化总体框架

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

以北京大学第三医院为例,因为医院的系统复杂,很多个性化修改在医改这个大环境下,压力蛮大。

北京大学第三医院服务量日均1.5万人,有时峰值达1.6万。门诊接待1.6万人的服务,系统压力很大,提供的数据量也很大。

与此同时,三院平均住院日是5.92天,低于6天,全国的平均数可能是9天多。5天多就周转一个病人出去,对于全院的职工来说,面对5700人做信息服务,支持的人群数和业务如此多。

医院信息化四大目标誉八大任务

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

四大目标

由于周转快、服务人群多。这时候只要是人,都会犯错。信息化的一大目的就是做要到减少人犯错,用一些智能化的手段进行辅助,减少错误,提高医疗质量。

第二是改善服务,当量多、人群基础大时,需改善医院为患者服务的所有流程以及成本控制。医改以后大家面临更多的是成本核算、绩效考核,以及提高服务效率。

八大任务

八项任务中,最后面是数据挖掘、数据应用、互联互通、协同发展的过程。

目前当今医院信息化框架跟以往不同,底层要求在灾备、安全、标准、规范、管理体系建设下,数据层需医院信息共享、对外信息交互。

那么该通过什么交互?

通过集成平台、全量数据中心、存储、支持医院的信息共享和对外的信息交互,构成医院信息化的总体评价。

医院数据如何去做集成融合与利用

总体而言,大家更加关注医院信息中心的数据中心怎么建和怎么用的问题。

这么多且复杂的业务系统,首先一定要关注硬件架构、灾备数据中心这些底层基础设施。

北大第三医院也建成了不同楼宇的主备机房,统一的数据存储平台和集群保护,基于虚拟化的体系来建立单点宕机,为数据实时同步。

在此之上大家总在说集成平台、数据中心,基于集成平台的业务系统,目前主业务就是进行交互的系统越频繁量越大越适合上平台。

现在有17个厂商的44个系统已经纳入了三院的平台,平台每天的交互量达到50多万。

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

很多人经常说,没有平台一样可以很好。

假设系统很好,也可以做点对点的对接,但随着系统越来越多,超过百个系统时,点对点的交互给信息人员,包括安全性、工作量都带来很大的困扰,这时候就得变成平台。

再举个例子,以前没有短信的时候,开会需要点对点一个一个打电话去通知每一个人,说几点在哪里开会,这其实就如同医院点对点的一个个去接系统一样。

而现在大家开会不需要点对点去对接,而是有群发功能。同样,现在的集成平台就是这个道理,基于消息发送,我只发送一次,需要的消费系统我就要订阅一下,所有的数据一致性,以及信息工作人员以前上线首先就要跟HIS接,上线一个新系统先要获取病人的信息,HIS的业务量是最繁忙的,上了平台以后发现的确减压最大的就是HIS,上哪个系统都要跟HIS接一遍,接HIS,接EMR,接LIS、RIS等,一切系统都要接一遍才能上线。

而且现在上线一个新系统非常快,就问一下平台,说平台上有这消息吗?说有,就订阅,订阅完就可上线。

它内部的订阅分发机制,整体的设计确实是技术人员该干的活,另外消息服务的标准要订。上了平台,对整体对接口的标准梳理,对信息工作人员所有系统的规范性,都是一个提高。

北京大学第三医院梳理了424个接口,发现只有275个是有效的。因为上线将近20年,很多无效的接口还残存着,通过数据接口,其实那些可以不用的,通过上线很多接口都停掉了。

所以以前的接口方式有很多种,比如说存储过程、示图、中间库、AIP、Web页面等,一系列简化为两种,非常简单干净。

平台上它是塔台,要有监控。平台解决什么问题?一个是病人主索引问题。

以前没平台,不知道它的数据不连续,本来是一个人,分段存储不是连续的。所以上了平台首先解决的患者主索引问题,主数据的管理。

以前分散业务系统每个都用自己的字典,数据管理不统一,数据报送不一样,所以要有监控,会监控所有平台的运转性能以及消息交互。

以前上系统,都会凭经验说最好周三上,为什么?看右下角峰值周四就证明医院周四的门诊量,服务量最高,这么高不能换。

因为要换系统,首先要找一个峰值比较低的更安全,一旦出问题解决受众人群要更少一点,所以相对低,那六日是半天低,但是六日只有值班的,人员也不足,就选择相对低的周三。

通过图上数据立刻就能看出来这么大的交互量,什么时间是峰值,什么时候相对少一些,即使看起来少,但其实也不很少,也是突破万级以上。

基于集成平台的数据一致性

集成平台解决数据一致性的问题,首先HR人力资源系统它的机构代码,人工、人事,原来都是在各个业务系统里。目前它首先要上平台,通过集成平台发送信息,一但有新员工、新机构,他同时发送的消息需要的就订阅下来。

另外这种平台数据的一致性有很多需要规范的地方,消息工具的监控预警,应急调用等,要有保障。

除了数据一致性,平台还需要高可靠性,服务量大,这对于平台的服务要求很高,高可靠性方面,做监控刚才说做预警,以及消息补发。

拿数据中心来讲,一天一个科的门诊量是2500,所以它的消息量非常高,监控出一旦有挤压就要调整,因为消息要排队去发送,包括跟工程师的短线联动,一出现问题,短线都会提醒工程师要做相应的调整,预警的峰值是多少,这都是专业技术人员要做的事情。

基于平台之上,通过平台路由存在数据中心里的数据,这件事是不同的。

为什么采用基于Haddoop的实时数据中心

因为其他传统型数据中心不能够满足这种大数据的处理,北京大学第三医院也第一次尝试在医疗、医院建立基于Hadoop这种大数据技术的实时数据中心,通过集中平台实时传送存储数据中心。至于为何选择Hadoop,主要出于它可高效处理海量数据。

当时尝试的时候,同时搭建传统型平台和Hadoop平台,最终发现大数据处理技术的确要比传统型的快20倍,满足了需求。

包括现在手机上的应用,需要随时刷新了解院内情况,只有它是满足的,秒级的传送数据。

这是一个比较,传统关键数据库在处理上有很大的劣势:

案例丨大数据中心在医院的落地,需如何去做集成融合与利用

所以当时选择大数据的架构进行尝试,并且尝试成功了。目前现在应用一年应用了,总体觉得还是很不错的。

数据中心也要有监控,各类业务系统67个在数据中心里,汇总的条目数已经超过16亿这么大的一个数据量,数据量已经40TB。

从2008年到现在,CIS上线以后所有数据都在里面,这样提供给下面的应用,不是为了建而建,而是为了用而建。

目前北京大学第三医院吞吐量的确日均接收55万这和总存储40个TB这么高的量级。

数据中心的6大特点

要建立数据中心,需突出这几方面:一个是实时性。如果还是传统的这种定时的,说到晚上抽提,那么这个时间差就没有。现在关注的,比如截止到目前差5分10点,目前的门诊量是多少,它会实时告诉我。如果你到晚上再去做任务定时来存储数据中心,那这个功能几乎就不能用,所以一定要实时。

其次是移动化,实时也要体现在移动方面,有些东西要在手机上看,不一定非得在办公室利用这些数据。

然后是集成与科研、领导决策、临床决策的支持。

说完建,再说用。

数据中心的应用以及它的优势

首先是流程的优化。

举个例子,人们一直说B超工作人员是检查数量最高的。

经过大数据分析后得出的结论,排在第一的检查科室确实是B超,这时候就可通过分析后优化流程。

以前的操作方式是B超医生写报告,而现在医生不用写报告,直接出来以后患者在自助机上刷卡自动打印,由患者来完成,减少患者的等候时间。这就是一个流程的优化,以前都是医生来做。

互联网+的应用,其实互联网+服务完全可以做到,通过数据中心从建卡、导诊、支付、分针、叫号、支付。数据中心目前的速度快到什么程度?数据中心秒级的推送,患者一下就能拿到报告了,然后去找分诊台要片子。

这时候发现信息的传递速度比腿要快很多,护士从洗印片子出报告之后传到你那里,都没信息快,后来故意把这一项给调慢了。

另外就是医疗质量,在消除信息技术孤岛集成展现,做了很多都在医生站上,以及在医生站上集成的病例检索、迅速定位,直接刷出来。

北大第三院外科做了全息情况,试图快速了解病人信息,做手术可减少差错,这种统一试图快速核对提高效率。

电子病例方面,北京大学第三医院从2008年上EMR电子病例,2010年上临床路径,2014年推移动,再到2015年集成平台数据中心,2016年数据平台挖掘应用,2017年是科研大年。

目前仅CDR就不够了,不仅是临床,而是全量,HDR数据协同。

移动层面,北大第三医院也做了很多移动端的应用,比如说移动医生站,麻醉医生站,会诊医生站。

麻醉医生非常喜欢移动端应用,术间有55个,移动应用让麻醉科医生觉得特别方便,所以麻醉科医生这边应用的最好。

另外也会进行医院决策分析,基于数据中心提供很多管理层实时多维的数据分析,管理着用手机也能看还目前的门诊、手术,科室之间的实时工作量,他能了解到整个全科、全院,从而来调整工作。

有一些病人、年龄、医保等大数据放在手机端也能很快呈现,为管理着的决策支持提供服务。

科研数据中心

最后一个就是科研,在数据中心之外同时要有一个科研数据中心。

大家知道临床数据和科研数据是交集,有些可以从临床数据产生,有些要外延,另外采集一些科研数据,所以要建立科研数据中心。

方式有很多种,一种是结合电子病例的模板改造,叫做临床科研演化,它从临床,从模板上采集就进来了。

另外一些的确是在模板、临床上不适合去采集,也扩大一些随访,在微信端,比如骨科用微信上传一些康复数据上来,结合EDC多中心的采集系统一起做,提高临床科研的智能化水平。

另外就是大家讨论比较多的分级诊疗,离不开远程优质资源共享,在平台进行线上远程分级诊疗系统。

总结下来就会发现,数据中心可提高医院整体的综合管理水平,让数据的集中存储、协同变得更加方便。对于决策支持也来得更及时,节约时间和运营成本。

对于任何一个医院的信息中心主任来说,他不希望去盯着每个人,也不可能跟孩子学习似的天天盯着效果看好不好。

北大三院也基于临床路径概念开发了一个项目追溯系统,从建系统立项开始,到验收全程追溯,在手机端可以看项目到底进行到了什么程度,数据来呈现。

医院软件信息化水平是需要持续改进的,但主要由于涉及的业务系统太多,改造数量难度很大,技术风险、管理风险、沟通风险也很高,因此医院应该全员配合,包括医院管理、临床、科研人员,通过积极配合的方式来消除一些孤岛。同时应该多利用项目管理工具,并把其运用到信息管理之中,里程碑都融入到PDCA项目管理中去。数据本身的应用要统筹有序,它是动态可持续发展的一个系统工程。



本文作者:亚峰
本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
机器学习/深度学习 算法 Python
CatBoost中级教程:集成学习与模型融合
CatBoost中级教程:集成学习与模型融合【2月更文挑战第13天】
68 3
|
26天前
|
数据采集 供应链 搜索推荐
数据集成:融合不同来源的数据
【6月更文挑战第4天】数据集成在企业中发挥关键作用,连接数据孤岛,促进信息流动,提升决策能力。通过抽取、清洗、转换和加载(ETL)不同来源、格式的数据,整合到统一框架,进行深度分析。以零售商为例,集成销售、客户和供应链数据可优化库存管理。数据清洗确保质量,转换满足分析需求,最终加载到数据仓库。Python和pandas库是实现这一过程的工具之一。随着技术进步,数据集成将推动企业向智能化和个性化发展。
46 2
|
16天前
|
机器学习/深度学习 人工智能 算法
【机器学习】机器学习与AI大数据的融合:开启智能新时代
【机器学习】机器学习与AI大数据的融合:开启智能新时代
24 1
|
7天前
|
分布式计算 运维 大数据
MaxCompute产品使用问题之数据集成任务有脏数据,如何快速定位哪些字段有问题
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
2月前
|
物联网 测试技术 持续交付
探索自动化测试在持续集成中的关键作用未来技术纵横谈:区块链、物联网与虚拟现实的融合革新
【5月更文挑战第27天】随着敏捷开发和持续集成(CI)的广泛采用,自动化测试已成为确保软件质量和快速交付的基石。本文将探讨自动化测试在持续集成流程中的核心地位,分析其如何提高测试效率、降低错误率,并支持快速的迭代开发。通过实例和数据支持,我们将深入理解自动化测试对于现代软件开发实践的重要性,并讨论实施自动化测试时面临的挑战及解决策略。
|
22天前
|
分布式计算 DataWorks 关系型数据库
MaxCompute产品使用合集之DataWorks是否支持通过SQL方式在MaxCompute中查询数据,并通过数据集成服务将查询结果同步至MySQL数据库
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
2月前
|
Dart 前端开发 测试技术
移动应用开发的未来:跨平台框架与原生系统的融合深入理解软件测试中的持续集成与持续部署(CI/CD)
【5月更文挑战第30天】 在本文中,我们将深入探讨移动应用开发领域的最新趋势:跨平台开发框架与原生操作系统的融合。随着移动设备成为日常生活的核心,高效、灵活且性能卓越的应用程序需求日益增长。文章分析了当前主流的跨平台工具如React Native和Flutter,并探讨了它们如何与iOS和Android等原生系统相互作用,以及这种融合对开发者、用户和整个移动生态系统意味着什么。我们还将预测未来可能的技术发展,并提出相应的策略建议。
|
2月前
|
存储 大数据 数据处理
矢量数据库与大数据平台的集成:实现高效数据处理
【4月更文挑战第30天】本文探讨了矢量数据库与大数据平台的集成,以实现高效数据处理。集成通过API、中间件或容器化方式,结合两者优势,提升处理效率,简化流程,并增强数据安全。关键技术支持包括分布式计算、数据压缩编码、索引优化和流处理,以优化性能和实时性。随着技术发展,这种集成将在数据处理领域发挥更大作用。
|
2月前
|
分布式计算 DataWorks 数据库
DataWorks操作报错合集之DataWorks使用数据集成整库全增量同步oceanbase数据到odps的时候,遇到报错,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
41 0
|
2月前
|
SQL 分布式计算 DataWorks
DataWorks操作报错合集之在DataWorks数据集成中,但是预览ODPS源数据库为空,是什么导致的
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
36 0