国外学者眼中的大数据:在社科研究中的运用尚在探索

简介:

运用大数据的社科研究尚在探索之中

用数据作分析已经成为当前科学研究大趋势。人们常常能够看到自然科学领域学者利用各种各样的数据解决科学难题。然而,社会科学领域学者对大数据的应用,仍在不断探索当中。近期,美国塞奇出版社发布报告《谁在做计算社会科学?大数据研究趋势》(Who Is Doing Computational Social Science?Trends in big data research)。报告认为,在社会科学领域中,使用大数据和运用大数据方式解决问题的学者并不十分普及,社会科学领域与大数据之间的关联程度也还不够,已使用大数据的学者在日常科研中还会遇到很多问题。为什么会出现这样的情况?本报记者采访了相关学者。

大数据吸引社科学者目光

数字化时代产生了非常多的数据源,它们可以来自社交媒体、非结构化文本、数字传感器、财务和行政事务处理表格等,一些数据甚至已成为具有应用性的商品。有人认为,对大数据的使用是年轻学者的“游戏”,但报告结论发现,事实并非如此。报告作者之一、塞奇出版社研究方法中心研究员凯蒂·梅茨勒(Katie Metzler)在报告中提到:职业生涯与数据使用之间没有必然联系。

梅茨勒说,这份报告通过调查世界各地的社会科学研究者,了解他们从事的研究是否与大数据有关,以及在实际应用中遇到的困难和挑战,总结当前社会科学领域应用大数据的趋势。从调查结果看,社会科学研究者有兴趣增强自己与大数据之间的联系,但其中仍存在挑战,例如,如何设计研究过程?怎样才能获得可靠的数据?

梅茨勒表示,起初研究人员与世界各地近50万名社会科学领域专家取得联系,最后收回9412份完整的调查问卷,其中有7933份来自学术界,其余的来自政府部门等。收回的问卷中较多的来自美国、英国、印度和加拿大,此外还有35个国家至少完成了50份问卷。可以说,此次问卷调查具有全球性。受访者在学科分布上也较全面,包括教育学、心理学、健康科学,收回超过1000份问卷,而文学、历史学、政治学、经济学、哲学、人口学、犯罪心理学等也收到了问卷回复。调查结果显示,1/3的受访者自定义其使用过大数据或大数据方法进行学术研究。在这些学者中,约60%的人在过去12个月中使用过大数据。而在其他2/3尚未接触过大数据的学者中,一半提到未来打算接触大数据或未来一定会把大数据运用在其科研中;剩下的一半学者不期望接触和运用大数据。

英国埃塞克斯大学社会学研究方法中心教授尼克·阿勒姆(Nick Allum)在接受本报记者采访时表示,从报告结论中可以看出,社会科学领域中对大数据的使用并不是很普及,这可能与社会科学学科有关。可以预见,那些常与数据打交道的学科,如社会学、统计学、经济学等可能会应用大数据,而哲学、历史学、文学等学科几乎用不到大数据。其实,使用大数据可以从另一个视角打开科研新思路,因此,未来如何让那些看起来与大数据不大相关的学科应用大数据至关重要。阿勒姆表示,要想采用以大数据为基础的学术研究方法,需要更加了解大数据,以及数据科学的内涵。

内容摘要:大数据吸引社科学者目光数字化时代产生了非常多的数据源,它们可以来自社交媒体、非结构化文本、数字传感器、财务和行政事务处理表格等,一些数据甚至已成为具有应用性的商品。探索之路依旧充满障碍埃塞克斯大学社会学研究方法中心学者安洁拉·丹曼(Angella Denman)表示,从自然科学研究者处理大数据的方式看,他们可以从事先设计好的仪器中接收到原始数据和信息,这些数据是他们想要的,符合他们的预期,是其科研成功的关键。很多学者想要尝试将自己的研究与大数据关联起来,一旦数据不准确或有缺陷,就会导致整个研究失败,这对学者来说是一个非常困难的选择。

关键词:学者;应用;社科;探索;使用;研究方法中心;学科;运用;社会科学研究者;问卷

作者简介:

探索之路依旧充满障碍

埃塞克斯大学社会学研究方法中心学者安洁拉·丹曼(Angella Denman)表示,从自然科学研究者处理大数据的方式看,他们可以从事先设计好的仪器中接收到原始数据和信息,这些数据是他们想要的,符合他们的预期,是其科研成功的关键。而社会科学领域学者往往更多或者只能从其他地方,如企业、政府、网络等渠道挖掘和分析数据,但这些数据收集的最初目的大多与学者应用的目的不同。例如,一些社交网站最初并不是为了收集个人相关信息而建立,其目的仅仅是为了协助人们交流和联系。

丹曼认为,数据来源有限是社会科学领域中大数据应用范围不广的主要因素之一。这一观点在报告中得到了印证。报告提出,在使用过大数据的学者中,他们使用过最常见的数据,首先是不同政府部门收集来的数据,包括卫生、教育或收入等;其次是社交媒体中的数据;最后是一些商业数据。数据来源非常有限,学者即便获得了数据,还需对其拆解和分析,找出可以使用的数据非常困难。同时,需要非常专业的数据分析软件或相关专业人员帮助,这也增加了学者的使用难度。在很多情况下,社会科学研究资助基金申请困难且有限。很多学者想要尝试将自己的研究与大数据关联起来,一旦数据不准确或有缺陷,就会导致整个研究失败,这对学者来说是一个非常困难的选择。

尽管大数据研究可能作为社会科学发展新的方向,但探索之路依旧充满障碍。因此,现在也是社会科学发展的一个转折点,社会科学发展需要更多新的技能、研究方法和计算工具等。社会科学领域的专家已经准备好应对未来可能面对的挑战,使社会科学知识真正应用于社会发展中。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
5月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
5月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
941 1
|
6月前
|
存储 并行计算 算法
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
270 4
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
232 0
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
存储 数据可视化 数据挖掘
大数据环境下的房地产数据分析与预测研究的设计与实现
本文介绍了一个基于Python大数据环境下的昆明房地产市场分析与预测系统,通过数据采集、清洗、分析、机器学习建模和数据可视化技术,为房地产行业提供决策支持和市场洞察,探讨了模型的可行性、功能需求、数据库设计及实现过程,并展望了未来研究方向。
816 4
大数据环境下的房地产数据分析与预测研究的设计与实现
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的题目——北京移动用户体验影响因素研究,提供了问题一的建模方案、代码实现以及相关性分析,并对问题二的建模方案进行了阐述。
352 0
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
本文探讨了基于Python大数据技术对京东产品评论进行情感分析的研究,涵盖了文本预处理、情感分类、主题建模等步骤,并运用了snwonlp情感分析和LDA主题分析方法,旨在帮助电商企业和消费者做出更明智的决策。
731 1
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题二建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的问题二的建模方案和Python代码实现,包括数据预处理、特征工程、模型训练以及预测结果的输出,旨在通过数据分析与建模方法帮助中国移动北京公司提升客户满意度。
317 2