如何用VOSviewer分析CNKI数据?

简介: 学会了用VOSviewer分析Web of Science数据后,想不想知道如何用它分析中文文献?本文用CNKI数据做样例,一步步教你实现步骤。image疑问自从写了《如何快速梳理领域文献》一文后,不少读者留言或者来信问我一个问题:如何可视化分析中文文献呢?image我之前没有用VOSviewer做过中文文献的梳理,所以还真不知道VOSviewer是否有这个功能。

学会了用VOSviewer分析Web of Science数据后,想不想知道如何用它分析中文文献?本文用CNKI数据做样例,一步步教你实现步骤。

img_fd9d66e1dcbc513a166d891d95b6b56b.jpe
image

疑问

自从写了《如何快速梳理领域文献》一文后,不少读者留言或者来信问我一个问题:

如何可视化分析中文文献呢?

img_3f771b570b588903beb573cc6b765d20.jpe
image

我之前没有用VOSviewer做过中文文献的梳理,所以还真不知道VOSviewer是否有这个功能。

但是我在博士毕业论文里用Citespace分析过中文文献,所以就用我最有把握的答案做了答复。

img_b211af48a823634bb92692932a21df3b.jpe
image

不过,随着问这个问题的人越来越多,我也来了兴趣:VOSviewer到底能否分析中文文献数据呢?

怀疑的原因,是因为之前在网上查资料时,看到的好像都是英文分析结果。而且VOSviewer的作者都是外国人,所以我不确认它对中文文献是否友好。

img_e5547b007244a0150f2b080325f926e9.jpe
image

于是,我决定验证一下。

验证的方法,不是直接拿软件来尝试,而是查文献。

验证

有句话,叫“在有鱼的地方钓鱼”,我觉得是至理名言。

如果有人用VOSviewer做过中文文献分析,你觉得这样的结果更可能在哪里出现呢?

新闻?博客?……不,一定是科研论文,而且是中文论文里。

我们到CNKI数据库里找找看。

在CNKI首页,以“VOSviewer”作为主题词检索。获得了以下结果。

img_f54db10ea167514a82fea68e4169e9f6.png
image

看来将VOSviewer作为研究工具的论文还真不少呢。

我们从标题寻找其中更有可能使用中文文献数据的论文,于是找到了这篇《2010年中国档案学研究热点的知识图谱分析》。

img_cef1ab45eb282a01f225bedc8fa0b746.png
image

看了摘要,确认该文使用中文期刊数据,分析工具为VOSviewer。

于是我们下载原文看看。

在文中显著位置,我们看到了这幅图。

img_00cbf1ce03c900a20b552f88720876f0.jpe
image

这幅图说明,VOSviewer不仅支持中文文献分析,而且至少从2011年就支持了。

好了,我们的疑惑解决了——VOSviewer可以分析中文文献数据。

自然地,下一个问题就是:

该怎么做呢?

数据

第一步当然是收集数据。

我们继续使用CNKI。这次我们以“图书情报知识”(情报学领域核心期刊之一)作为“文献来源”检索词搜索。

img_5815970501ddc3b2b2d5b1163312a366.png
image

获得的结果,有4700多条。我这里连接网速不够快,4700多条文献记录都下载下来,需要很久。咱们精炼一下,只选择2016年的数据。

img_30ed35951a6a7df57a753e15e38ccddb.png
image

2016年的记录,一共有101条。我们每次50条,不断翻页,全部勾选。

img_0a557bfb055b81255bb0ac69673f5440.png
image

勾选完毕后,选择“导出/参考文献”。

img_d16bfb32edec3397219e4051af518465.png
image

在屏幕的左侧,我们可以看到不同的导出类型。

问题来了,该导出哪一种呢?

这时我们打开VOSviewer,瞄一眼,看VOSviewer可以接受哪些格式。

img_59a601ae9b964ee197cf2c885779d000.jpe
image

这里我们看到了Web of Science, Scopus, PubMed, RIS等格式。

我们的目标,是取CNKI导出格式,与VOSviewer导入格式的交集。

结果令人很苦恼——交集为空。

到这里,我大概知道为什么这么多读者发问了。不少人可能在CNKI上做到了这一步,然后就不知道该怎么办了。

其实你不必焦虑。因为文献记录格式之间,是可以转换的。

img_0634b9fa4d95b982489058a26563d0be.png
image

我们选择其中的Endnote格式,导出。

img_1b0eb99379d37c8d26a8ae59bac07a29.png
image

根据提示,存储导出的txt文件。

我们打开这个文本文件,看看内容。

img_d2ef2a6e243056335a5052d471792cae.jpe
image

经检验,数据完整导出。下面我们就要尝试格式转换了。

转换

我们的目标,是把数据转化为VOSviewer可以支持的格式类型。

我们打开Endnote。

img_196b598e6ca2175fe86cb79d1030db97.jpe
image

从主菜单里,选择“导入(Import)”。

img_a725d151e0f779ebd95b7998577c855b.jpe
image

在弹出的窗口里,浏览并找到我们刚刚从CNKI导出的txt文件。

img_174092290512fd96c9c227e83b78c3bc.jpe
image

注意,此时不要直接导入文本文件,否则导入结果是空的

我们需要调整一下选项。点击文件浏览窗口左下角的“Option”。

img_e5147176fadde772ce3c0a82e84f8dc2.jpe
image

点击其中的第一项,可以看到许多选项。Endnote作为老牌的文献管理工具,支持的数据格式很丰富。

img_05be5d9d4a2058aaf7d224be237e558d.jpe
image

选择“Endnote Import”。这样Endnote才知道,我们导入的,是Endnote自己的交换格式。

img_e5147176fadde772ce3c0a82e84f8dc2.jpe
image

点击确定后,你就能看到100余篇文献正确导入进来了。

img_f9f1e023b1e91da225603407bb1b1aff.jpe
image

我们在这里对文献做粗略筛选。略去“卷首语”和重复文章,同时略掉没有作者的(一般是征稿启示等内容)文章。

img_5f49365cea840af66fcc6fecb3fa2a30.jpe
image

筛选后的文献选中,选择“导出”(Export)。

img_9352554280d24554b7a90d670ee5f1b8.jpe
image

Endnote会提示我们导出的选项。

img_6f577c3d328828c21f3b69a481d2e909.jpe
image

我们把输出的文件名设定为有意义的名称。注意要把“Output Style”选择为“RIS”格式。

如果你的菜单里面没有“RIS”格式,可以先选择“Select another Style”。

img_f99330cf77bf2276eb37dd2a13a60fa3.jpe
image

然后你会看到许许多多的导出格式选项,下拉列表到“R”开头的区域,找到“RIS”。

img_9fa6875790fd261f31914913913eba6d.jpe
image

选择后,“RIS”就被添加进来了。

默认导出文件扩展名是txt。我们将其修改为ris,以方便VOSviewer识别。

我们打开RIS文件看看内容:

img_4f1c0e4f51ab1ba93c13fa9ea5b16f25.jpe
image

可以看到,元数据都被保留,但是组织格式发生了变化。

至此,利用Endnote转换文献记录格式环节顺利完成。我们终于可以愉快地分析CNKI文献了。

分析

在VOSviewer中选择“Create”。会弹出以下对话框。我们选择第二项。

img_aa3f9a7068ba04b8c9773452e0958be3.jpe
image

然后我们需要选择导入文献的类型和位置。

img_da96d8895071b2c2f0fe423ed60a0c51.jpe
image

点击“RIS”标签页,利用文件选择器,定位到刚刚Endnote导出的RIS文件上。

img_44c6791cebf9a7ce5b2531c0559eb94d.jpe
image

下面选择分析类型,我们选择作者共现(Co-authorship)分析。

img_b87dd3e5a72ff57d05f83c4326f40161.jpe
image

因为文章篇数太少,我们不得不把阈值定低一些。

img_bc8631c7ee9244816673ac63dbf10cb3.jpe
image

弹出的对话框里,我们可以依据实际情况,把某些记录过滤掉。这里我们选择保持不变。

执行后,就能看到Co-authorship分析结果了。

img_6288a7b49ec03e73e570e1b3d4d27b57.jpe
image

我们放大结果图,看看细节。

img_264642d7e0e086dbda2535ebe0c4605c.jpe
image

图中中文显示一切正常。

至此,咱们利用VOSviewer分析CNKI文献记录的演示完成。

小结

回顾一下,本文主要介绍了以下内容:

  1. 我们确认了VOSviewer不止可以分析英文文献,也可以分析中文文献;
  2. 验证猜想,需要找证据。找证据的关键,是在最可能的地方着手搜索和挖掘;
  3. 文献记录的格式多种多样,但是其间大多是可以转换的。Endnote作为桥梁,可以帮我们把CNKI的导出结果转换为VOSviewer需要的RIS格式。

讨论

读过本文后,你是否了解如何用VOSviewer分析中文文献数据?你之前做中文文献可视化分析时,用过不同的方法吗?它们是否更有效和便捷呢?欢迎留言,把你的经验分享给大家,我们一起交流讨论。

这里给你留个思考题:如果要做引文分析,CNKI的数据可以吗?希望你能亲自动手尝试一下,把结果反馈给我。

如果你对我的文章感兴趣,欢迎点赞,并且微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)。

如果本文可能对你身边的亲友有帮助,也欢迎你把本文通过微博或朋友圈分享给他们。让他们一起参与到我们的讨论中来。

延伸阅读

如何用《玉树芝兰》入门数据科学?

数据科学相关文章合集(玉树芝兰)

目录
相关文章
|
26天前
|
数据可视化 数据挖掘
如何利用数据可视化工具来发现处理后数据中的异常或不一致?
在使用这些可视化工具时,需要仔细观察图形中的细节,结合数据的背景和业务知识,来准确判断是否存在异常或不一致。同时,也可以通过交互操作和深入分析来进一步挖掘潜在的问题。
42 2
|
4天前
|
机器学习/深度学习 传感器 运维
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
本文探讨了时间序列分析中数据缺失的问题,并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集,采用线性回归和决策树回归两种方法进行缺失值补充,并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示,决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳,而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣,并给出了实际应用建议。
27 7
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
63 0
|
7月前
|
数据采集 数据可视化
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
利用Python进行历史数据预测:从入门到实践的两个案例分析
利用Python进行历史数据预测:从入门到实践的两个案例分析
364 1
|
7月前
|
前端开发 数据挖掘
【SPSS】频数分析和基本描述统计量详细操作教程(附实战案例)
【SPSS】频数分析和基本描述统计量详细操作教程(附实战案例)
2304 0
|
数据挖掘
2-华大时空组学分析软件 Spateo 空转数据基础分析用法示例
本分分享了使用华大时空组学分析软件 Spateo进行聚类、DE等简单空间转录组分析的用法示例,以供参考
1076 1
|
编解码 自然语言处理 数据可视化
MIM方法为什么简单高效?可视化和大规模实验给出了答案
MIM方法为什么简单高效?可视化和大规模实验给出了答案
220 0
MIM方法为什么简单高效?可视化和大规模实验给出了答案
|
存储 数据可视化 atlas
对于组学数据的分析和展示来说,maftools算是一个宝藏“R包”,可用于MAF格式的组学数据的汇总,分析和可视化展示。
对于组学数据的分析和展示来说,maftools算是一个宝藏“R包”,可用于MAF格式的组学数据的汇总,分析和可视化展示。
568 0
|
机器学习/深度学习 人工智能 算法
谈谈从分析到行动看数据驱动和数据信息的区别
近年来,“数据驱动”这个术语已经被广泛使用,很多人谈论要成为一个数据驱动的组织。
谈谈从分析到行动看数据驱动和数据信息的区别