全球健康开放数据概览

简介:

什么是开放数据?

一个简单的回答是:互用性。互用性指的是不同系统和组织间协同工作 (协同操作) 的能力。在这里,它指的是协同操作或者混合不同数据集的能力。


我们采用「开放知识定义」来定义开放数据:


开放数据是一类可以被任何人免费使用、再利用、再分发的数据——在其限制上,顶多是要求署名和使用类似的协议再分发。


完整的「开放知识定义」对于这一定义给出了更为翔实的解释。这里总结出最关键的部分:


  • 可获取性和可访问性:作品应当能够被完整获取,并且所需的花费应当不超过合理的重制费用 (较好的获取方案是提供从网络下载数据)。数据也必须使用方便修改的格式。

  • 再利用和再分发:数据应当使用允许再利用和再分发 (包括与其他数据集整合后再分发的情况)的许可协议。

  • 普遍参与性:每一个人都应当能够使用、再利用、再分发那些数据。因此就不允许有限制个人或团体使用的协议。比如,「非商业用途」限制就会限制「商业」用途因此不被允许。又比如限制只能在规定领域使用数据(比如只能在教育领域使用)也是不被允许的。


下图来自于技术作家Joel Gurin的专著《Open Data Now》,解释了大数据、政务公开和开放数据之间的关系:


什么是开放数据的好处?

政府鼓励社会对完全开放数据的再利用,企业可以基于免费、开放的数据构建可行的商业模式。越来越多的企业开始使用开放数据,未来五到十年,使用开放数据的企业将随处可见。


新加坡政府开放数据门户专门提供了数据再利用应用程序,如通过OneMap平台向开发人员提供数据集虚拟化功能。此外,新加坡公共机构Up Singapore还举办了开放数据创新竞赛,特别是医疗卫生方面的Health Up Challege竞赛,鼓励对医疗卫生开放数据再利用。“OpenData500”网站项目由NYUGovLab管理,除了展示以开放数据驱动的企业外,还将探寻这些企业的商业模型和盈利方式。首批企业列表已经公布在网站上。


医疗卫生领域开放数据的目的是什么?

  • 提高医疗卫生系统透明度:通过展示覆盖面广、深度合适和总量大的医疗卫生公共数据,有助于提高医疗卫生系统的透明度。

  • 为患者提供便利服务:通过开放卫生机构和卫生从业人员的医疗质量方面的数据,可以帮助公众选择合适的卫生机构、专业人员以及相关治疗信息。

  • 鼓励数据再利用和创新:企业和个人基于开放的医疗卫生数据,可以构建新型商业模式为患者和医疗卫生机构、专业人员提供更好的服务。


Archimedes是一个非常好的例子。该公司利用医疗数据、临床研究数据创建了决策支持工具。反过来,它又构建了API,帮助开发者将糖尿病管理的最佳实践指南整合入用户关注的卫生、健康、临床支持、生活方式应用中。


医疗卫生领域开放数据的类型是什么?

以下为各个国家的应用情况,数据来源于法国卫生部开放数据委员会报告


医疗卫生领域开放数据的有利因素是什么?

各国政府都有强烈的开放意愿,许多国家通过制定公共数据开放战略来推动公共数据开放,鼓励经济创新和政府信息透明化。


具备健全的政策法规环境,部分国家具备了与信息权利相关的所有法律。此外,部分国家还通过法律、法规或政府文件要求公共部门开放数据。例如,加拿大政府2010年的《获取信息法》要求地区公共机构公布数据清单并按相关格式要求开放数据;美国的《医治保险携带和责任法案》有利促进了“医疗保险和医疗补助”数据库的建立。


完善数据库系统,医疗卫生数据的收集、处理和汇总工作对数据开放的范围、深度等都有影响。许多国家负责汇集医疗卫生数据的公共机构有力地促进了广域数据库的建立,具有重要的作用。


全球医疗卫生领域开放数据比较

不同国家因卫生系统组织结构、司法环境、历史和政治环境的不同,开放数据的策略也各具特色。首先来看一下最具参考性和代表性的5个国家(英国、美国、加拿大、丹麦和新加坡)公共数据开放战略的时间线。

中国医疗卫生领域开放数据的现状

全国的开发数据可以从每年的卫生统计年鉴中获取,最近的数据是2013中国卫生统计年鉴(http://www.nhfpc.gov.cn/htmlfiles/zwgkzt/ptjnj/year2013/index2013.html)也可以从国家数据(http://data.stats.gov.cn/)中获取信息。


以下的城市目前建立了开放数据平台,提供了卫生机构的一些信息,但数量较少,有待进一步发展。

  • 数说南海(http://data.nanhai.gov.cn/cms/sites/sjzy/index.jsp)

  • 上海市政府数据服务网(http://www.datashanghai.gov.cn/gds/home!toHome.action)

  • 北京市政务数据资源网(http://www.bjdata.gov.cn/)

  • 无锡市政府数据服务网(http://opendata.wuxi.gov.cn/)


参考资料
Open Data Handbook
美国健康开放数据
The Governance Lab@NYU
New Open Data on Healthcare.gov Obamacare Health Insurance Plans
英国健康开放数据
Health &Socail; Care Information Centre in UK
全球医疗卫生领域公共数据开放比较
彭彬彬:开放医疗数据将构成新型的医患互动
开放数据:2014年最热门的竞争领域
French Open Data in Health Commission submits new report


编者介绍
杨晓春,上海成趣信息科技有限公司 独立IT顾问 热爱技术,是技术潮流的跟风者,动脉网创业圈成员,动脉网特约撰稿人。玩过硬件,焊过板子,研究过人工智能。互联网时代,建过电子商务网站,做过教育产品。爱折腾,在各种类型的公司里积累了很多经验,感谢在盛大和HP遇见良师益友。在硅谷受启迪,现在创业从事移动医疗产品的开发,致力于数据分析、互联网、移动应用和IT咨询培训。


原文发布时间为:2015-01-02

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
安全 算法 量子技术
密码学系列之十:量子密码
密码学系列之十:量子密码
|
Java 程序员
收藏!阿里毕玄16篇文章,深度讲解Java开发、系统设计、职业发展
阿里毕玄结合自己的经历深度讲解Java开发、系统设计、职业发展等问题,快来一键收藏吧。
35244 1
|
4月前
|
机器学习/深度学习 算法 机器人
【机器人路径规划】基于A*算法的机器人路径规划研究(Python代码实现)
【机器人路径规划】基于A*算法的机器人路径规划研究(Python代码实现)
632 4
|
移动开发 人工智能 算法
商场触摸屏导视系统如何破解线下导航难题?从技术逻辑到体验升级全解析
本文介绍了商场触摸屏导视系统作为实体商业智慧化的核心工具,通过技术革新解决了大型商场的“寻路困境”。它以精准垂直搜索、多维POI展示和智能路径规划为特点,结合H5宣传与跨设备交互功能,提升顾客体验和场景运营效率。
239 1
商场触摸屏导视系统如何破解线下导航难题?从技术逻辑到体验升级全解析
|
8月前
|
Linux
在线对Linux进行磁盘扩容的技术指南。
综上所述,Linux磁盘扩容的过程,重要的不仅是技术,更是对每一步骤的深刻理解和投入的爱心。只要手握正确的工具,我们不仅能满足"孩子"的成长需求,还能享受其中的乐趣和成就。
520 10
|
存储 人工智能 数据管理
【云故事探索】基于阿里云助力地理产业2.0落地,实现遥感数据智能化管理
中国某遥感数据服务中心借助阿里云ECS、GPU和OSS服务,成功实现了地理信息产业升级。此前,中心面临数据管理混乱、服务响应慢等问题。通过阿里云的解决方案,构建了全生命周期管理的遥感数据平台,强化了自动化、智能化的数据生产能力,提升了数据服务的准确性和及时性。此外,平台还增强了数据共享,扩大了应用范围。未来,中心计划结合AI技术,探索地理信息3.0时代,利用阿里云的人工智能平台进一步提升数据管理和应用能力。
805 1
|
数据采集 监控 数据可视化
数据质量:电商零售数据管理根基
电商零售数据管理是企业数字化发展的核心竞争力。它包括市场洞察、运营优化和客户关系管理,通过数据收集、整理、分析与应用,实现精准决策与高效运营。然而,数据管理面临数据质量、安全与隐私、集成融合及人才短缺等挑战。使用板栗看板等工具,可有效提升数据可视化、实时监控、团队协作与决策优化,助力企业挖掘数据价值,增强市场竞争力。
三大运营商那个流量便宜
要确定中国三大运营商(中国移动、中国联通、中国电信)中哪个提供的流量套餐更为便宜,并不是一个可以直接给出固定答案的问题,因为不同的地区、时间、以及用户的具体需求(如通话时长、短信数量、数据流量等)都会影响套餐的价格和性价比。不过,以下是一些通用的方法来比较和选择较为经济的流量套餐:
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】大语言模型系列-Transformer
Transformer是一种深度学习模型,最初由Vaswani等人在2017年的论文《Attention is All You Need》中提出,它彻底革新了自然语言处理(NLP)领域。在此之前,循环神经网络(RNNs)及其变体,如长短期记忆网络(LSTMs)和门控循环单元(GRUs),是处理序列数据(包括文本)的主流方法。然而,Transformer通过引入自注意力(self-attention)机制,解决了RNNs在处理长序列时存在的梯度消失、计算速度慢等问题,实现了并行化计算,大大提高了训练效率
591 9
|
缓存 网络协议 Unix
程序员超实用的文件系统性能评测工具盘点
程序员超实用的文件系统性能评测工具盘点