国外学者眼中的大数据:在社科研究中的运用尚在探索

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

运用大数据的社科研究尚在探索之中

用数据作分析已经成为当前科学研究大趋势。人们常常能够看到自然科学领域学者利用各种各样的数据解决科学难题。然而,社会科学领域学者对大数据的应用,仍在不断探索当中。近期,美国塞奇出版社发布报告《谁在做计算社会科学?大数据研究趋势》(Who Is Doing Computational Social Science?Trends in big data research)。报告认为,在社会科学领域中,使用大数据和运用大数据方式解决问题的学者并不十分普及,社会科学领域与大数据之间的关联程度也还不够,已使用大数据的学者在日常科研中还会遇到很多问题。为什么会出现这样的情况?本报记者采访了相关学者。

大数据吸引社科学者目光

数字化时代产生了非常多的数据源,它们可以来自社交媒体、非结构化文本、数字传感器、财务和行政事务处理表格等,一些数据甚至已成为具有应用性的商品。有人认为,对大数据的使用是年轻学者的“游戏”,但报告结论发现,事实并非如此。报告作者之一、塞奇出版社研究方法中心研究员凯蒂·梅茨勒(Katie Metzler)在报告中提到:职业生涯与数据使用之间没有必然联系。

梅茨勒说,这份报告通过调查世界各地的社会科学研究者,了解他们从事的研究是否与大数据有关,以及在实际应用中遇到的困难和挑战,总结当前社会科学领域应用大数据的趋势。从调查结果看,社会科学研究者有兴趣增强自己与大数据之间的联系,但其中仍存在挑战,例如,如何设计研究过程?怎样才能获得可靠的数据?

梅茨勒表示,起初研究人员与世界各地近50万名社会科学领域专家取得联系,最后收回9412份完整的调查问卷,其中有7933份来自学术界,其余的来自政府部门等。收回的问卷中较多的来自美国、英国、印度和加拿大,此外还有35个国家至少完成了50份问卷。可以说,此次问卷调查具有全球性。受访者在学科分布上也较全面,包括教育学、心理学、健康科学,收回超过1000份问卷,而文学、历史学、政治学、经济学、哲学、人口学、犯罪心理学等也收到了问卷回复。调查结果显示,1/3的受访者自定义其使用过大数据或大数据方法进行学术研究。在这些学者中,约60%的人在过去12个月中使用过大数据。而在其他2/3尚未接触过大数据的学者中,一半提到未来打算接触大数据或未来一定会把大数据运用在其科研中;剩下的一半学者不期望接触和运用大数据。

英国埃塞克斯大学社会学研究方法中心教授尼克·阿勒姆(Nick Allum)在接受本报记者采访时表示,从报告结论中可以看出,社会科学领域中对大数据的使用并不是很普及,这可能与社会科学学科有关。可以预见,那些常与数据打交道的学科,如社会学、统计学、经济学等可能会应用大数据,而哲学、历史学、文学等学科几乎用不到大数据。其实,使用大数据可以从另一个视角打开科研新思路,因此,未来如何让那些看起来与大数据不大相关的学科应用大数据至关重要。阿勒姆表示,要想采用以大数据为基础的学术研究方法,需要更加了解大数据,以及数据科学的内涵。

内容摘要:大数据吸引社科学者目光数字化时代产生了非常多的数据源,它们可以来自社交媒体、非结构化文本、数字传感器、财务和行政事务处理表格等,一些数据甚至已成为具有应用性的商品。探索之路依旧充满障碍埃塞克斯大学社会学研究方法中心学者安洁拉·丹曼(Angella Denman)表示,从自然科学研究者处理大数据的方式看,他们可以从事先设计好的仪器中接收到原始数据和信息,这些数据是他们想要的,符合他们的预期,是其科研成功的关键。很多学者想要尝试将自己的研究与大数据关联起来,一旦数据不准确或有缺陷,就会导致整个研究失败,这对学者来说是一个非常困难的选择。

关键词:学者;应用;社科;探索;使用;研究方法中心;学科;运用;社会科学研究者;问卷

作者简介:

探索之路依旧充满障碍

埃塞克斯大学社会学研究方法中心学者安洁拉·丹曼(Angella Denman)表示,从自然科学研究者处理大数据的方式看,他们可以从事先设计好的仪器中接收到原始数据和信息,这些数据是他们想要的,符合他们的预期,是其科研成功的关键。而社会科学领域学者往往更多或者只能从其他地方,如企业、政府、网络等渠道挖掘和分析数据,但这些数据收集的最初目的大多与学者应用的目的不同。例如,一些社交网站最初并不是为了收集个人相关信息而建立,其目的仅仅是为了协助人们交流和联系。

丹曼认为,数据来源有限是社会科学领域中大数据应用范围不广的主要因素之一。这一观点在报告中得到了印证。报告提出,在使用过大数据的学者中,他们使用过最常见的数据,首先是不同政府部门收集来的数据,包括卫生、教育或收入等;其次是社交媒体中的数据;最后是一些商业数据。数据来源非常有限,学者即便获得了数据,还需对其拆解和分析,找出可以使用的数据非常困难。同时,需要非常专业的数据分析软件或相关专业人员帮助,这也增加了学者的使用难度。在很多情况下,社会科学研究资助基金申请困难且有限。很多学者想要尝试将自己的研究与大数据关联起来,一旦数据不准确或有缺陷,就会导致整个研究失败,这对学者来说是一个非常困难的选择。

尽管大数据研究可能作为社会科学发展新的方向,但探索之路依旧充满障碍。因此,现在也是社会科学发展的一个转折点,社会科学发展需要更多新的技能、研究方法和计算工具等。社会科学领域的专家已经准备好应对未来可能面对的挑战,使社会科学知识真正应用于社会发展中。

本文转自d1net(转载)

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
12月前
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
存储 数据可视化 数据挖掘
大数据环境下的房地产数据分析与预测研究的设计与实现
本文介绍了一个基于Python大数据环境下的昆明房地产市场分析与预测系统,通过数据采集、清洗、分析、机器学习建模和数据可视化技术,为房地产行业提供决策支持和市场洞察,探讨了模型的可行性、功能需求、数据库设计及实现过程,并展望了未来研究方向。
603 4
大数据环境下的房地产数据分析与预测研究的设计与实现
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的题目——北京移动用户体验影响因素研究,提供了问题一的建模方案、代码实现以及相关性分析,并对问题二的建模方案进行了阐述。
285 0
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
本文探讨了基于Python大数据技术对京东产品评论进行情感分析的研究,涵盖了文本预处理、情感分类、主题建模等步骤,并运用了snwonlp情感分析和LDA主题分析方法,旨在帮助电商企业和消费者做出更明智的决策。
480 1
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题二建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的问题二的建模方案和Python代码实现,包括数据预处理、特征工程、模型训练以及预测结果的输出,旨在通过数据分析与建模方法帮助中国移动北京公司提升客户满意度。
229 2
|
数据采集 搜索推荐 大数据
基于大数据的市场分析与消费者行为研究
【6月更文挑战第5天】大数据在市场分析与消费者行为研究中扮演关键角色。通过海量数据分析,企业能更全面、精准地了解消费者偏好和市场趋势。Python等工具帮助处理数据,揭示购买习惯,支持个性化营销策略。同时,大数据使深入理解消费者心理、决策过程成为可能,助力企业优化产品,提升客户满意度和忠诚度。在这个数据驱动的时代,大数据是洞悉市场和消费者的魔法力量。
564 2
|
SQL 分布式计算 Hadoop
[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅
[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅
339 0
|
人工智能 安全 大数据
喜报|瓴羊Dataphin入选上海市经信委2023创新攻关成果、IDC企业大数据治理研究代表产品
喜报|瓴羊Dataphin入选上海市经信委2023创新攻关成果、IDC企业大数据治理研究代表产品
275 0
|
存储 人工智能 Cloud Native
云原生大数据架构实践与思考-DataFunTalk
导读: 作者:振策-阿里云计算平台-产品解决方案, 20230805 本文将分享当前云原生大数据架构的发展历程/架构定义/核心能力/应用场景及趋势思考。主要包括以下四个部分: - 从大数据上云看架构 - 云原生数据平台的核心能力 - Data+AI with Cloud-Native - 未来趋势与思考
2776 0
|
机器学习/深度学习 存储 运维
论文阅读--异常检测中实时大数据处理的研究挑战
论文阅读--异常检测中实时大数据处理的研究挑战

热门文章

最新文章