中国医疗大数据“痛点” :孤岛怎么破

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

近年来,医疗大数据炙手可热。那么何为医疗大数据?

与医疗健康相关的信息,均可被归入医疗大数据的范畴,数据来源可以是医疗和科研机构,亦可来源于个人甚至政府。其应用场景十分广泛,如药品研发,精准医疗,医保控费,个人健康管理,个性化用药,甚至分级诊疗、远程医疗等。从以太的经验来看,中国医疗大数据的应用各环节有一些共同的痛点。

数据孤岛

首先从机构层面看,在政府政策主导下,当前已经有70%以上的医院实现了医疗信息化,基础设施建设层面已经初见成果。

然而当前仅有不到3%的医院实现了数据互通:传统系统厂商数量众多,据不完全统计,当前国内HIS系统厂商超过500家,PACS系统厂商超过200家,厂商为医院单独设计实施系统,且不同系统会出现不同版本。使用传统方式聚合一家系统需耗时2-6个月,对医院数据采集和聚合耗时费力。尽管有移动医疗、远程医疗的一些创业公司会部署新的系统获取数据,然而众多互联网医疗产品的接入,造成了医患双方的额外负担。

其次,从个人角度来看,当前常见的直接获取个人数据的渠道主要有两个:可穿戴设备的佩戴或移动设备的使用,上门检测获取用户数据。然而这两种获取渠道对于用户来说都处于市场导入期,存量市场微乎其微,导入和说服成本巨大。

比如2016年中国的可穿戴设备仅有200亿市场规模,从使用习惯的角度而言,即使是美国2015年的数据,也仅有3%的美国人保有可穿戴设备。此外,用户的使用习惯和意愿也是数据获取的大敌,2015年美国市场研究公司NPD Group的一份调研指出,超过40%的运动手环用户会在半年内弃用该设备,无法获得周期性可持续的数据。

上门检测用户数据当前常见的是血液检测和基因检测,从服务切入,未来通过数据积累应用到科学研究、医药用品研发、用户个人健康管理等场景,然而由于该类服务成本高,用户接受度低,数据获取也受到诸多限制。

事实上,针对前文提出的机构数据痛点,当前已经有一部分创业公司开始对数据进行整合,打造数据中间件。然而由于医疗机构之间的壁垒、检测水平、试剂选取等原因,数据口径和相关指标无法直接使用的情况依旧存在。个人数据源层面,不同数据分析厂商也会造成标准不统一的问题。

在具体实施层面,对于这些稀缺的个人数据如何整合,如何对不同领域和议题下的主题进行定义以及统计口径的协调将成为应用前的重要环节。在商业环境当中,这也将面临利益分配、如何分工合作以及伦理问题。

工具的缺失

医疗大数据能够发挥作用,还要看实际的应用和解读,如何正确解读数据,让数据对临床、个人健康、公共卫生、医疗保险等领域进行指导是医疗大数据最终落地的必备环节。

在任何垂直应用场景中,“know-how”都是很重要的一环。好的医疗数据领域的分析师也应当兼具垂直领域的专业知识和数据分析的基本能力,能够将业务和数据实现有效的整合。然而作为最匹配的复合型学科生物统计学在国内尚属起步阶段,由于数据市场上整体数据分析人才的缺失,能够落地到垂直领域的人数愈发受到限制。

其次是工具层面的短板,笔者在做数据工作的时候,有一个定性的发现:SAS、R、MATLAB等相对高门槛的工具在医疗行业里应用非常广泛,学科的限制导致了对工具的高要求,然而可视化的报表,直观的展现方式,能够有效提升分析的效率,“让专业的人做专业的事”。

隐私的边界

数据分析之后,如何落地,如何对患者体现价值也是当前数据应用的问题。对政府的部分数据更多反推至政策的制定当中,药品研发数据的最终落地和验证周期会更长。数据的价值如何对个体患者的体现,可否是个体用户可感知的输出,实际的作用如何去评估和衡量都是医疗大数据面临的问题。

此外,医疗数据采集、加工和应用的过程中,对于用户隐私的保护也十分重要,基于患者的属性,如检测指标和结果等,可直接对用户行为进行预判,如个人信息泄露带来的虚假推销等问题,因此,关注数据如何应用到个人层面的同时,信息泄露问题也是留意的重点之一。

第三方数据厂商打入医疗机构,并且使数据能够得以有效应用也面临推广的压力:高度资源导向型的医疗行业,行业、院校、机构、地域均面临重重壁垒,即使是上市公司也依旧无法打入某些区域,商务拓展难度和落地难度极大,一方面难以获取有效数据源,另一方面也没有足够的场景训练自身的模型。

对于这种情况,一些创业者采取了两条腿走路的方式:比如以太协助融资成功的“数联易康”,其一方面整合自身资源,不断与卫计委和医院进行商务拓展;另外一方面有效借助商业机构的网络,打破地域限制,快速实现自身的成长。或者如“永数”,直接通过产品创新,获取全国性标杆机构的支持,绑定进行推广。 

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
机器学习/深度学习 搜索推荐 大数据
大数据在医疗健康领域的革新作用
【6月更文挑战第1天】大数据在医疗健康领域展现出巨大潜力,助力疾病预测、精准诊断和个性化治疗。通过分析医疗数据,预测风险、辅助诊断,并定制治疗方案。示例代码展示了使用LogisticRegression进行疾病预测。随着技术发展,大数据将为医疗健康带来革命性进步,保障人类健康。
158 1
|
4月前
|
存储 搜索推荐 大数据
大数据在医疗领域的应用
大数据在医疗领域有广泛应用,包括电子病历的数字化管理和共享,提升医疗服务效率与协同性;通过数据分析支持医疗决策,制定个性化治疗方案;预测疾病风险并提供预防措施;在精准医疗中深度分析患者基因组信息,实现高效治疗;在药物研发中,加速疗效和副作用发现,提高临床试验效率。此外,在金融领域,大数据的“4V”特性助力业务决策前瞻性,被广泛应用于银行、证券和保险的风险评估、市场分析及个性化服务中,提升运营效率和客户满意度。
565 6
|
4月前
|
人工智能 编解码 搜索推荐
大模型、大数据与显示技术深度融合 加速智慧医疗多元化场景落地
大模型、大数据与显示技术深度融合 加速智慧医疗多元化场景落地
|
7月前
|
搜索推荐 安全 大数据
大数据在医疗领域的应用与前景
【6月更文挑战第26天】大数据在医疗领域提升服务效率,助力疾病预防与精准治疗。电子病历优化数据管理,疾病预测预防个性化医疗成为可能。未来,智能医疗系统普及,远程医疗兴起,数据共享促进行业发展,同时隐私保护与安全备受关注。大数据正重塑医疗,开启健康新篇章。
|
8月前
|
存储 关系型数据库 测试技术
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
92 4
|
8月前
|
大数据
大数据在医疗领域的应用有哪些?请举例说明。
大数据在医疗领域的应用有哪些?请举例说明。
164 0
|
大数据
《从数据治理看医疗大数据的发展》电子版地址
从数据治理看医疗大数据的发展
124 0
《从数据治理看医疗大数据的发展》电子版地址
|
SQL 存储 分布式计算
Apache Hudi在医疗大数据中的应用
本篇文章主要介绍Hudi在医疗大数据中的应用,主要分为5个部分进行介绍:1. 建设背景,2. 为什么选择Hudi,3. Hudi数据同步,4. 存储类型选择及查询优化,5. 未来发展与思考。
368 0
Apache Hudi在医疗大数据中的应用
|
数据采集 数据可视化 大数据
智慧医疗大数据解决方案
随着医院信息化建设不断发展,医疗数据规模日益增长,医疗服务全面进入“大数据时代”。
3102 0
智慧医疗大数据解决方案
|
机器学习/深度学习 存储 人工智能
后疫情时代的城市医疗大数据,需要怎样的建设“方法论”?
找准自身定位,医疗大数据产业的上下游企业将大有可为。城市级健康医疗大数据体系建设,是一个很宏大的命题。