中国工程院院士:大数据研究,不要成为无关痛痒的“白开水”

简介:

大数据正以两年翻一倍的速度爆发性增长,国家对大数据在产业政策层面向好,阿里巴巴、腾讯、百度等互联网巨头都在布局大数据领域……我们对大数据的关注前所未有。不过,中国工程院院士、同济大学教授郭重庆日前在复旦大学举办的一场论坛上指出,目前国内大数据研究与产业发展均处在起步阶段。“数据研发尚停留在处理阶段,数据开放五到十年难见成效,大数据人才是最大的劣势……”他呼吁,要用反思与批判性思维看待大数据研究,不要无关痛痒的“白开水”。

数据采集是大数据研究的基础,对数据开放的呼声一直很高。但郭重庆认为,目前数据的跨部门、跨行业、跨地域流动还很难,而真正实现数据开放恐怕在五到十年都难以实现。

数据分析是大数据研究的核心。“数据只有经过挖掘、分析、优化、决策,并提供解决方案,才能最终产生价值,但目前我国大数据研究还停留于数据处理。能进行大数据分析的引擎产品仍为国外产品主导。”郭重庆说,在最近发布的全球“大数据产业发展趋势全景图3.0”中,共标注了全球358家涉及大数据分析处理的权威公司,但没有一家中国公司来入围。

数据交易是促进大数据产业发展的基石,但这方面发展也不理想。郭重庆指出,当下数据的权属不明,行业标准和规范缺失,数据交易的合规性也存在争议。

此外,在数据科学理论、发展与解读新知识的技术能力,数据产业发展水平以及数据人才教育等诸多方面,我国都尚处于起步阶段,不能乐观高估。

不过, 郭重庆也指出,我国发展大数据还是有很多优势。如,在大数据产业发展的政策层面向好。国务院发布有关纲要要求,2017年底前形成跨部门数据资源共享共用格局,2018年建成国家政府数据统一开放门户等。又如,我国数据存储、运算技术,芯片、服务器及软件技术以及移动互联和消费、服务等领域都走在世界前列。“可以预计在五年到十年以内,中国庞大的大数据市场足以支持不同行业出现若干个世界级大数据平台的企业。”

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
7月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
7月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
1361 1
|
8月前
|
存储 并行计算 算法
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
364 4
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
337 0
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
存储 数据可视化 数据挖掘
大数据环境下的房地产数据分析与预测研究的设计与实现
本文介绍了一个基于Python大数据环境下的昆明房地产市场分析与预测系统,通过数据采集、清洗、分析、机器学习建模和数据可视化技术,为房地产行业提供决策支持和市场洞察,探讨了模型的可行性、功能需求、数据库设计及实现过程,并展望了未来研究方向。
894 4
大数据环境下的房地产数据分析与预测研究的设计与实现
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的题目——北京移动用户体验影响因素研究,提供了问题一的建模方案、代码实现以及相关性分析,并对问题二的建模方案进行了阐述。
400 0
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
本文探讨了基于Python大数据技术对京东产品评论进行情感分析的研究,涵盖了文本预处理、情感分类、主题建模等步骤,并运用了snwonlp情感分析和LDA主题分析方法,旨在帮助电商企业和消费者做出更明智的决策。
831 1
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题二建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的问题二的建模方案和Python代码实现,包括数据预处理、特征工程、模型训练以及预测结果的输出,旨在通过数据分析与建模方法帮助中国移动北京公司提升客户满意度。
391 2