大数据时代,推倒“数据烟囱”何以这么难

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

一直以来,科研数据都被视作生产者的“私产”,尽管越来越多的研究团体发现了数据共享的好处,可以通过开放数据访问和使用的合作,使其学科取得了重大进展,但大范围、海量科研数据的开放共享依然是多年以来一块难以融化的“坚冰”。

近日,中国科学院为纪念科学数据库建库30周年,正式对外宣布其“十二五”期间建成的科学数据云将面向科技界和企业研发人员免费开放共享。

提起科学数据云不得不提到中科院科学数据库,作为中科院科学数据库重大工程项目的直接参与和组织管理者,原中科院科学数据库办公室主任李望平从1987年便参与到“中国科学院科学数据库及其信息系统项目”的建设中。

“与现在社会上其他数据不同的是中科院科学数据库保存的大部分数据都是在长期的科研活动中产生的实验、观测和研究结果等科研数据,是国家的宝贵财富。”李望平告诉记者,科学数据库的建设是属于科学的基础性工作,要通过长期持续的数据积累才能展现出其内在的应用价值。

多年来,中科院一直在推动科学数据库的共享和应用服务,目的就是让这批宝贵的科学数据资源为社会发挥更大的作用。

从最初的14家建库单位、21个数据库,发展到“十二五”期间58家单位、1340个数据库,中科院科学数据库整合了从资源学科领域到植物学科领域等多领域数据库资源,提供共享数据量已从2.68gb增加到655tb,年均在线访问超过千万人次。名称也从最初的“中国科学院科学数据库及其信息系统”变成了“科技数据资源整合与共享工程”。

“现在,中科院科学数据库已经实现由数据积累和软硬件建设向环境构建、工程化项目向持续化发展转变,以云服务模式为基础,形成了支持科研活动与科技创新的数据云,并从基础设施、数据资源、应用平台三大类服务的角度整合集成了各类资源和服务。”作为第四代科学数据库牵头单位和支撑单位主要学科带头人的黎建辉思考更多的是,如何运用迅速发展的信息技术推进中科院乃至我国的科研信息化和科技创新。

“多年来,我们一直强调科学数据库要面向社会提供应用服务。”李望平透露,中科院科学数据库是最早实现在互联网上提供科学数据查询和数据下载服务的。

“中科院数据云的开放更多的是一种引领,是一种率先行动,是一种为国家科技创新服务的必然。”在黎建辉看来,国家项目资助的科学工作者有义务通过创造和传播新知识,为公共谋福利,而关联数据是知识的固有成分。能够为已发表科学结论提供证据的数据,应以智能开放的形式同时公开。

事实上,在开放共享的道路上,中科院一直在行动。以生物信息学分子数据分析环境、地理空间数据云、dviz大数据可视化等应用的推出,创新和发展了多学科领域数据、模型及云服务应用的技术手段与服务模式。

2015年8月,中科院计算机网络信息中心成功申请并获批我国首批试点网络连续性出版物,创办《中国科学数据》期刊,推动科学数据出版与数据引用,进一步促进我国科学数据资源的开放与共享。

在服务科研的同时,中科院数据云还面向社会需求不断加强产业化创新服务,提升拓展技术优势。在交通管理、食品安全、新材料研发等公共领域,与国家发改委、食药监总局、北京地税等三十多家企事业单位开展相关合作。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
11天前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
79 14
|
2月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
82 0
|
3月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
98 4
|
3月前
|
分布式计算 DataWorks 数据处理
在数据浪潮中前行:记录一次我与ODPS的实践、思考与展望
本文详细介绍了在 AI 时代背景下,如何利用阿里云 ODPS 平台(尤其是 MaxCompute)进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向,同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径,为企业提供高效、低成本的大规模数据处理方案。
213 3
|
3月前
|
SQL 人工智能 分布式计算
ODPS:数据浪潮中的成长与突围
本文讲述了作者在大数据浪潮中,通过引入阿里云ODPS体系(包括MaxCompute、DataWorks、Hologres)解决数据处理瓶颈、实现业务突破与个人成长的故事。从被海量数据困扰到构建“离线+实时”数据架构,ODPS不仅提升了数据处理效率,更推动了技术能力与业务影响力的双重跃迁。
|
4月前
|
数据采集 人工智能 算法
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
114 1
|
12天前
|
传感器 人工智能 监控
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
84 14
|
22天前
|
机器学习/深度学习 传感器 监控
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
57 1
|
22天前
|
数据采集 自动驾驶 机器人
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
78 1
|
2月前
|
机器学习/深度学习 监控 大数据
数据当“安全带”:金融市场如何用大数据玩转风险控制?
数据当“安全带”:金融市场如何用大数据玩转风险控制?
89 10

热门文章

最新文章