革新大数据时代学刊评价体系

简介:

大数据时代的来临,对人类社会产生广泛而深刻的影响。如何运用信息资源开放、共享、互动、即时的特点,实现学术期刊在大数据时代的整合与创新,发挥数据在期刊评价中的积极作用,是学界关注的问题。记者近日就相关问题采访了专家学者。

量化维度是期刊评价与大数据契合点

作为一场新的技术革命,大数据不同凡响的作用使学界联想到在学术研究和学术评价领域,大数据是否也会带来某些变化,甚至是革命性的变化?答案似乎是肯定的。《南京大学学报(哲学·人文科学·社会科学)》执行主编朱剑在接受记者采访时表示,学术研究中,采集和运用数据进行研究已成为一种公认的方法。与学术研究相比,在学术评价中,数据的作用更是无处不在。一方面,根据数据制作的各种排行榜和排名表大行其道;另一方面,围绕数据的意义和作用的争论也从未平息,对学术评价的质疑和诟病几乎都与数据有关。两方面的对立呈胶着状态,迫切需要新元素的介入来改变现状。在这样的情境下,大数据自然被寄予了更多的期望。

由于大数据前所未有的可量化的维度,因而将大数据用于学术期刊评价将会引起期刊评价方式的重大变革。谈到目前存在的几个期刊评价机构,《武汉大学学报(哲学社会科学版)》副主编刘金波认为:“严格讲,这些机构都没有解决期刊评价的根本问题,其评价方法也不是严格意义上的大数据评价方法。”在他看来,将大数据引进期刊评价同样要解决“谁来评”、“评什么”和“如何评”这些评价的前提和根本问题。刘金波告诉记者:“首先,谁来评?学术期刊评价无外乎官方评价和民间评价,应建立公益性的非营利学术机构作为评价主体。其次,评什么是导向问题。评价内容对学术期刊建设、对国家学术繁荣与创新、对作者研究方向与范式都有指导性作用和积极性意义的,才是良性评价。最后,大数据时代学术期刊如何评?一般来说,评价学术期刊的影响力较为客观。指标可以有影响因子(即年与多年)、载文量、引文率、摘转率(即年与多年)、作者(来源、职称、学历、地域)、基金(来源、级别)、选题(学科、栏目、方向),等等。”

评价体系出现数据化转向

大数据对评价影响的程度有多大?这种影响是正面的,还是负面的?这些都成为专家学者思考的问题。朱剑表示,要让大数据发挥正面的积极作用,首先,应该弄清楚学术评价的现状及其问题的症结到底何在;其次,应该准确地描述和分析这些问题与数据以及数据处理方法之间有着何种关系;最后,看大数据是否有助于这些问题的解决,以及解决的条件是否具备,从而判断大数据能在多大程度上改变学术评价现状。

中国社会科学院哲学研究所科学技术哲学研究室主任段伟文表示,大数据对期刊评价的影响将出现一些新的方向。第一,在评价理念上,评价由主体到客体再到主体的双向互动性增强。这主要表现在通过新媒体或社交网络,挖掘相关学术读者的评论、作者的回复以及研究者的评价,通过转发或转载率获得学术期刊传播的广泛性社会效果评价。第二,在评价方法上,将通过数据采集、受众反应等方式,在一定程度上反映某些学术研究的热点与前沿方向。第三,在评价对象上,作为学术成果发表的重要平台,一方面,学术期刊的质量反映了学术内涵和发展方向;另一方面,所谓的大数据、全数据从网络信息空间为社会评价提供了重要参考,通过更加鲜明的数据特征,将数据进行整合,对期刊评价进行动态追踪。“应将充分采集的海量信息,通过语义舆情的分类进行细化,多维度地对学术期刊进行评价,将影响因子、转载率等正式评议与自媒体、公众号等非正式评议相结合,真正发挥大数据期刊评价的重要作用。”

刘金波认为,大数据将对学术期刊评价带来巨大冲击。数字出版模式更加广泛,如目前一些学术期刊数字化方面的网站已经具备了十分强大的数字出版功能,可以进一步提高中国学术期刊的整体水平。大数据时代将使以刊评文成为历史,从而形成真正的以文评刊。随着大数据的数据完备、分析功能完善,数据分析更加便捷,学术不端、虚假学术成本更加高昂,期刊数据造假将成为历史。针对不同需要的分类评价将大量出现,从量的评价将进而影响到关系分析与价值判断,科学合理的评价将进一步促进学术繁荣。

预防工具理性陷阱

对于大数据的使用,专家学者提醒要预防掉入工具理性陷阱。朱剑认为,不管是否在大数据时代,包括学术评价在内的所有评价都会受到以下六个方面因素的影响和制约:其一,是否具备成熟的并且为公众(特别是评价对象)普遍认可的评价理论。其二,是否具备在评价理论指导下的成熟的并且为公众(特别是评价对象)普遍认可的科学评价方法。其三,是否具备学术评价所必需的干净清洁的学术环境和学术评价环境。其四,是否具备具有专业水准和公信力的评价主体,能够担当起进行公正合理的学术评价的责任。其五,能否收集到足以满足评价方法的准确的评价信息。其六,是否具备对评价信息进行有效处理的能力。只有同时满足了上述条件,才可能得出科学合理的评价结论。

朱剑认为,与前大数据时代相比较,大数据以及相应技术显然可以更容易地部分满足上述第五和第六个条件,从而有可能在评价中更好地发挥数据的作用。但是,科学评价所必须具备的六个条件,特别是前四个条件并不会因为大数据时代的到来而自然而然地就具备了。即使是后两个条件,也不仅仅是数据的量级和运算的能力问题,所以也不会因为大数据时代的到来就一定能取得突破。专事定量评价的各机构几乎垄断了所有的数据挖掘与运算排序,而这些机构显然不具备上述基本条件。

在朱剑看来,撇开前四个条件不论,即使最擅长的数据处理也不可能完成,因为由于它们没有能力对数据及运算结果予以专业解析,只能将经运算排序的结果作为评价的结论发布出来,评价的过程在此已告中断。今天的各种排行榜和排名表大多是这样的未完成产品。没有学术共同体的主导,这样的所谓定量评价,不仅无法发挥大数据的优势,而且已成为大数据在学术评价中应用的障碍。

正因为如此,过分地迷信评价机构的大数据技术,就有可能掉入工具理性的陷阱。这些基于大量数据及运算而制作的各种排行榜和排名表的科学性始终受到学界的质疑。刘金波告诉记者,大数据时代,学术期刊评价中应将定量评价和同行评议重新整合,加以创新。

“大数据的海量信息将极大地影响到同行评价。任何一位学者个体,其知识储备与大数据比较起来都是沧海一粟。在评价其论文选题的热度、数据的新颖性、关键词的使用频率、文献来源的广度等方面,大数据都有巨大优势。但是,同行专家在选题的价值、方法的科学性、论证的逻辑性、论文的社会反响判断等多方面则更具优势。大数据的数据信息将更好地服务于同行专家的价值判断。”刘金波说。

在段伟文看来,如何将期刊评价与学术评价相结合是大数据时代研究的重要领域,数据评价不仅要以数据说话,还要挖掘数据背后的含义,在基于传统的量化、计量学、统计学基础上,分析数据指标的真正意义,同时需要学术一线的科研人员参与到大数据评价中去,从而将学术评价规范化、制度化、准确化。将定量评价与定性评价相结合,实现评价方式的转变和优化,避免出现相关利益群体利用数据造假的行为,从而建立更加科学准确有价值的学术期刊评价体系。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
分布式计算 DataWorks 安全
深入解读:获Forrester大数据能力高评价的阿里云DataWorks思路与能力
Forrester发布了Now Tech: Cloud Data Warehouse Q1 2018报告,报告对云化数据仓库(Cloud Data Warehouse, CDW)的主要功能、区域表现、细分市场和典型客户等进行了全面评估。
14321 0
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
36 0
|
3月前
|
机器学习/深度学习 存储 分布式计算
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
|
2月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 1
|
4月前
|
存储 SQL 大数据
dataCompare大数据对比之异源数据对比
dataCompare大数据对比之异源数据对比
110 0
|
2月前
|
分布式计算 关系型数据库 数据库连接
MaxCompute数据问题之数据迁移如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
2月前
|
分布式计算 Cloud Native MaxCompute
MaxCompute数据问题之没有访问权限如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
12天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
14 3

热门文章

最新文章