大数据环境下的社科文献情报研究

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

信息技术正飞速发展,互联网已被普及利用,各种终端设备记录了人类社会复杂频繁的信息行为,从而产生了惊人的数据量。在大数据时代,数据分析被提升到了前所未有的高度。这无疑会给社会科学文献情报研究带来巨大的挑战,同时也使它迎来了重要的发展契机。本文对大数据分析和社会科学文献情报研究的关系进行对比研究,同时对大数据环境下社会科学文献情报研究的发展趋势进行展望。

大数据分析(Big Data Analytics,BDA)是指对大数据进行分析,从中找出可以帮助决策的隐藏模式、未知的相关关系以及其他有用信息的过程。大数据分析方法众多,有些适合社会科学文献情报研究,有些不适合社科文献情报研究,其中数据挖掘方法与社科文献情报研究关系最为密切。

大数据分析与情报研究都是对数据和信息进行分析研究,把研究成果提供给用户,其工作过程几乎完全一致。因此,两者之间存在着许多共性。但是,由于两者产生于不同的时代,科学技术、社会发展的背景导致了两者之间又存在不少的差异性。总之,大数据分析与社会科学文献情报研究既有联系又有区别。

大数据分析与社会科学文献情报研究的共性主要表现在三个方面:看重对数据的定量分析、关注多源数据融合,以及强调相关性分析。大数据的基础和社会科学文献情报研究的基础一致,都是数据。大数据的特点是数据量大、种类多、价值低、速度快。大数据分析是采用一系列技术方法对各种数据进行定量分析,从而达到去粗取精、化繁为简、沙里淘金的目的。社会科学学科之间相互交叉渗透,新学科不断涌现,传统学科越分越细,使得社科情报研究面对的数据量越来越大。传统的社会科学文献情报研究单靠人力已经无法胜任。使用新方法、新技术对数据进行定量分析成为必然。使用定量分析是社会科学文献情报研究与大数据分析之间最为突出的一个共性。关注多源数据融合是社会科学文献情报研究与大数据分析之间的又一个共性。大数据环境下,数据的来源越来越多。只靠一两个来源完成分析研究是不可能的,研究的结果必然是片面的,甚至是错误的。只有把各种来源的数据进行融合,才能保证其分析研究的准确性和科学性。此外,大数据分析与社会科学文献情报研究都强调相关性分析,这也是两者间的共性之一。

大数据分析与社会科学文献情报研究的差异性主要表现在四个方面。数据对象方面:大数据分析以数值信息为主,社会科学文献情报研究则以文本信息为主。数据规模方面:大数据分析是大而全,而社会科学文献情报研究是适度数据,突出关键。分析任务方面:大数据分析强调挖掘新模式,社会科学文献情报研究却任务明确、模式既定。分析时机方面:大数据分析采用实时分析,而社会科学文献情报研究分析有时滞。

总之,大数据分析是社会科学文献情报研究的一个组成部分,是社会科学文献情报研究所必须掌握和使用的技能之一,是社会科学文献情报研究的前期准备工作,是社会科学文献情报研究的一个重要工具。

大数据环境下情报研究面临新环境,主要是面对新的研究对象、新的研究方法和工具。大数据环境下情报研究的对象是全新的,新就新在数据量更加巨大,数据形式、数据来源更加多样化,非结构化数据成为情报研究新的对象。

大数据环境下情报研究的方法和工具也是全新的。在情报搜集和获取方面,传统的方法和工具遇到了性能瓶颈;在数据组织方面遇到了如何将复杂数据转化为简易数据的问题;数据分析更加抽象,其计算量呈指数级上升。传统的情报研究方法和工具已不能适应新的情况,新的方法和工具应运而生。传感技术、互联网技术、大规模存储技术、云计算技术成为了情报研究新的工具。而数据挖掘方法、社会网络分析方法等已成为情报研究新的方法。

当前大数据环境下社科文献情报研究发展有三方面的新趋势。一是对新型数据源加以分析研究和综合利用。在大数据环境下新型信息资源不断涌现,种类繁多。这就要求社会科学文献情报研究必须加强对新型信息资源的分析研究,并对种类繁多的新数据源加以综合利用。二是大数据环境下,数据、信息分析的新技术、新方法层出不穷。社会科学文献情报研究必须引进新技术、使用新方法。三是大数据时代,社会发展、经济发展、科技发展一体化的程度越来越高。社会科学各学科之间,社会科学与自然科学之间各学科交叉、融合,许多学科越分越细、新学科不断涌现。这就要求社会科学文献情报研究拓展和深化其领域,不同领域之间在方法和视角上要相互借鉴,不同学科、不同研究机构间要加强协作。

面对新形势新问题,社会科学文献情报研究积极谋求应对之道。首先,转变观念。在大数据时代,传统的社会科学文献情报研究观念必须转变。只有转变观念,才能与时俱进,开拓社会科学文献情报研究的新局面。其次,借鉴方法。大数据时代来临,产生了许多新的数据分析方法,很多值得社会科学文献情报研究借鉴。其中数据挖掘、知识发现、海量数据的基本统计分析方法尤为重要。再次,引进技术。大数据时代,计算机技术、数据库技术都取得了飞跃式的进步。引进技术势在必行。最后,培养人才。大数据时代,社科情报研究人员必须掌握和熟练运用上述新的方法和新的技术。人才培养迫在眉睫,这也是社会科学文献情报研究的当务之急。

20世纪50年代情报学是在信息大爆炸背景下诞生的。随着科技进步与社会发展,大数据时代来临是历史的必然。历史赋予了社会科学文献情报研究新的使命,带来了新的机遇。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
27天前
|
SQL 机器学习/深度学习 分布式计算
大数据-81 Spark 安装配置环境 集群环境配置 超详细 三台云服务器
大数据-81 Spark 安装配置环境 集群环境配置 超详细 三台云服务器
52 1
|
23天前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
46 1
|
2月前
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
3月前
|
存储 数据可视化 数据挖掘
大数据环境下的房地产数据分析与预测研究的设计与实现
本文介绍了一个基于Python大数据环境下的昆明房地产市场分析与预测系统,通过数据采集、清洗、分析、机器学习建模和数据可视化技术,为房地产行业提供决策支持和市场洞察,探讨了模型的可行性、功能需求、数据库设计及实现过程,并展望了未来研究方向。
131 4
大数据环境下的房地产数据分析与预测研究的设计与实现
|
3月前
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的题目——北京移动用户体验影响因素研究,提供了问题一的建模方案、代码实现以及相关性分析,并对问题二的建模方案进行了阐述。
87 0
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
|
3月前
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
本文探讨了基于Python大数据技术对京东产品评论进行情感分析的研究,涵盖了文本预处理、情感分类、主题建模等步骤,并运用了snwonlp情感分析和LDA主题分析方法,旨在帮助电商企业和消费者做出更明智的决策。
126 1
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
|
3月前
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题二建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的问题二的建模方案和Python代码实现,包括数据预处理、特征工程、模型训练以及预测结果的输出,旨在通过数据分析与建模方法帮助中国移动北京公司提升客户满意度。
73 2
|
4月前
|
JSON 分布式计算 大数据
MaxCompute操作报错合集之连接环境时,出现报错:TypeError: access_id and secret_access_key,该怎么解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
5月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用问题之如何同步两个环境的参数
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
26天前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势