2.8亿条、49.1TB数据免费用!中国人口与健康科学大数据首次对社会公布

简介: 近日国家人口与健康科学数据共享平台在国家人口与健康科技资源发布会上,首次向社会发布我国人口与健康领域的大数据资源。本次发布的大数据数据量高达49.1TB、2.8亿条,包括生物医学、基础医学、临床等七大类。这将有利于进一步推动人口与健康科学数据共享,带动生物医学数据资源整合与共享。

2017年1月4日,国家人口与健康科学数据共享平台在国家人口与健康科技资源发布会上,首次向社会发布我国人口与健康领域的大数据资源。本次发布的大数据数据量高达49.1TB、2.8亿条,包括生物医学、基础医学、临床、公共卫生、中医药学、药学、人口与生殖健康七大类。

b78df1739bfdae7dca0e22d1c56cadafb5bff2f4

中国工程院院士、共享平台管理中心主任刘德培院士说,此次发布的数据较为详尽地反映了我国居民健康状况。以我国国民体质与健康数据库的建设为例,抽样调查了16个省份的48个县市居民,其中4省还进行了二次跟踪调查,指标涉及12大类、240余项,还包括生理信号和图像类数据。

据刘德培介绍,为保护数据提供者权益和个人隐私,共享平台在建设过程中,自动为每个数据集提供唯一标识,并为数据提供者创立电子注册证书。在数据导出时,去掉个人姓名等关键信息,实现个人隐私安全。

平台承担了健康数据建设重任

2016年10月,“健康中国2030”规划纲要强调推进健康医疗大数据应用。国家人口与健康科学数据共享平台在此背景下向社会发布我国人口与健康领域的大数据资源,对落实国家人口与健康大数据政策有着重大意义。作为中国科学数据共享工程重大项目立项的国家人口与健康科学数据共享平台承担着国家科技重大专项、科技计划、重大公益专项等人口健康领域科学数据汇交、数据加工、数据存储、数据挖掘和数据共享服务的任务。

中国工程院院士、中国医学科学院院长曹雪涛表示,数据难以共享是我国医学健康大数据开发应用的最大瓶颈。共享平台首次向社会公开发布数据资源,有利于进一步推动人口与健康科学数据共享,促进相关领域的科学研究成果和数据红利得到充分释放,带动生物医学数据资源整合与共享,为推进健康中国建设,实现健康中国2030的战略目标发挥更大作用。

共享平台建设始于2002年,历经四期建设工程,如今已发展成为国家科技基础条件重要平台之一。平台的科学数据总量已达到67.76TB,并与10多个国家建立了科学数据共享,其数据分类和组织框架得到了国际权威部门的认可。“十二五”期间,该平台的数据已累计服务形成科研成果数91个,支持政府决策数155个,支持重大工程102个,支持应急事件43个,服务民生数144项。

2.8亿条数据极为详尽

e1e27096bcc77a2134fe26c15770550616702502

此次发布的数据较为详尽地反映了我国居民健康状况。以我国国民体质与健康数据库的建设为例,该调查采用分阶段、随机、整群抽样的调查数据。目前,该数据库已经存储了三阶段,来自全国十余个省份不同民族16万受试者、二百余项的体质与健康指标数据,并存储了相关图形图像数据,总量已超过50G。该数据库可以为客观地反映国民的生长发育、重要器官功能、以及疾病的流行趋势等体质与健康水平提供参考数据,可用以评估我国在不同的社会和经济发展阶段人口的健康水平,评估人口流动及农村城市化给人口健康带来的影响,评估环境污染及其治理措施所产生的人群健康效应,为我国重大疾病的研究提供基础数据和科技支撑。同时,也可为政府制定人口与健康相关的宏观决策提供重要的科学依据。


来源:软件定义世界
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
5月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
401 14
|
5月前
|
传感器 人工智能 监控
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
189 14
|
4月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
391 0
|
5月前
|
机器学习/深度学习 传感器 监控
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
188 1
|
5月前
|
数据采集 自动驾驶 机器人
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
442 1
|
7月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
249 4
|
7月前
|
分布式计算 DataWorks 数据处理
在数据浪潮中前行:记录一次我与ODPS的实践、思考与展望
本文详细介绍了在 AI 时代背景下,如何利用阿里云 ODPS 平台(尤其是 MaxCompute)进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向,同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径,为企业提供高效、低成本的大规模数据处理方案。
385 3
|
7月前
|
SQL 人工智能 分布式计算
ODPS:数据浪潮中的成长与突围
本文讲述了作者在大数据浪潮中,通过引入阿里云ODPS体系(包括MaxCompute、DataWorks、Hologres)解决数据处理瓶颈、实现业务突破与个人成长的故事。从被海量数据困扰到构建“离线+实时”数据架构,ODPS不仅提升了数据处理效率,更推动了技术能力与业务影响力的双重跃迁。
|
6月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
369 0
|
7月前
|
SQL 人工智能 分布式计算
在数据浪潮中前行:我与ODPS的实践、思考与展望
在数据驱动决策的时代,企业如何高效处理海量数据成为数字化转型关键。本文结合作者实践,深入解析阿里云自研大数据平台 ODPS 的技术优势与应用场景,涵盖 MaxCompute、DataWorks、Hologres 等核心产品,分享从数据治理到实时分析的落地经验,并展望其在 AI 与向量数据时代的发展前景。
287 70