译自:Application and Development Trend of Data Visualization in Library
来源:STEMM出版社期刊数据库
数据可视化在图书馆中的应用及发展趋势
摘要
为说明数据可视化在图书馆的应用实践,以CNKI期刊数据库收录的期刊论文为研究对象,运用Excel 2016数据统计软件和VOSviewer1.6 . 19等可视化分析软件。将数据可视化在图书馆应用的研究成果分为4个阶段对研究热点和趋势进行可视化分析。图书馆行业数据可视化应用的研究重点逐渐从数据分析转向数据服务。随着社交媒体的广泛使用,图书馆比以往更加重视用户数据素养的培养、知识服务的数字化、信息一目了然的可视化、数字人文的研究等。数据可视化技术为用户打开了一扇用数据洞察图书馆知识资源的窗口,加快了数字图书馆向智慧图书馆转型的进程。
关键字:数据可视化;图书馆;VOSviewer;知识服务;智慧图书馆
1. 介绍
视觉在人类感知外部信息的过程中起着绝对的主导作用。可视化分析的有点是可以一目了然,起到“一图显春秋”的效果。数据可视化技术在行业具有很强的应用潜力。结合图书馆特点,创新应用数据可视化手段和方法,提高管理水平。图书馆界也越来越重视可视化技术的应用。
2. 数据可视化的概念和特点
2.1 概念
教据可视化是利用数据分析披术、数据可视化工具,以图形、图像的形式,将海量数据中的特殊数据可视化,以发现海量数据中隐威的信息[1]。数据的采集、预处理、存储和挖掘对数据可视化有很大的影响。
2.2 特性
2.2.1 直观、清晰
人类大脑对视觉信息的处理速度远远快于对文字信息的处理速度。数据可视化使人们能够直观地洞察海量数据背后的关系特征和规律,便于快速理解所获取的信息并做出相应的决策。数据可视化具有交互性和优秀的可视化效果,显示效果优于传统的统计图表,提高了用户体验[2]。通过运用不同的表达方式,设计信息元素,通过图形、图表、色彩、文字等直观的表达手法,传递抽象的信息和数据,将复杂的信息简化、可视化、组织化。
2.2.2快速反映数据更新状态
数据可视化技术通过实时更新数据信息,方便图书馆管理者快速发现新的机会或问题,及时做出整改决策。
2.2.3 促进沟通顺畅
数据可视化消除干扰信息,避免语言模糊和沟通无效,将重点内容清晰呈现,提高沟通效率。
3. 知识服务管理
数据可视化技术可用于图书馆的管理和服务。它不仅可以为读者提供书目数据和课题研究协助,还可以用于评价图书馆和改进馆藏结构。
3.1 知识服务管理
3.1.1 纸质图书借阅可视化
纸质文献借阅是图书馆知识服务的基本功能。可视化技术可以根据主题、时间段、借阅金额等不同标准,对读者的借阅情况进行一目了然的显示。由于借款情况可以实时更新,因此可以随时发现变化并采取相应的措施。基于大数据,建立用户画像可视化框架,结合借阅研究图书馆资源利用率。
3.1.2 促进数字馆藏的检索和分析
当今的图书馆正处于由数字化向智能化转变的过程中。图书馆可以对数字馆藏(如历代古籍代表性目录)进行数字化,并在此基础上进行可视化分析。通过构建交互式可视化分析系统,为基于大规模数据的数字馆藏文献分析提供全面有效的研究工具[3]。为了实现数字图书馆中搜索结果的基于主题的可视化,Bakhshayesh等人提出了基于主题的文档检索。将文档作为主题的载体,然后利用向量空间模型进行信息检索,检索与用户查询相关的文档,同时通过环形图将每个文档可视化,在每个文档和查询中显示主题。Bakhshayesh等人也对他们提出的基于主题的可视化方法进行了评估,结果显示:67%的用户更喜欢基于主题的文档检索,80%的用户认为提出的可视化方法是实用的[4]。
3.1.3 学科服务
借助数据可视化,可以为用户提供多种学科服务。以主题分析服务和标杆服务为例。课题分析服务可以为学校研究部门提供基于课题的分析报告。比如ESI分析,通过定期检测整个高校的整体科研水平,可以客观的了解整个高校的整体科研绩效
例如,某高校各学科计算的总被引频次与阈值的对比分析图如图1所示。
从图1可以看出,Subject 1已经进入ESI全球前1%,Subject 2、Subject 3、Subject 4属于学校的强势学科,但相比之下,Subject 2是最接近全球前1%的。如果大学给予更多的科研支持,很可能会加快进入世界前1%的门槛。
可以对国内外相关高校的学科领域进行标杆分析,了解不同研究领域和高水平研究团队的研究现状和发展趋势。研究文献来源数据库采用中国知网(CNKI),检索范围为学术期刊,检索方法为SU =(“康复”和“中医”),研究文献发表时间截止到2023年5月31日,作者单位为山东中医药大学和黑龙江中医药大学。因此,对两所中医院校的研究现状进行标杆性分析,如图2所示。
图1某高校各学科总被引频次及阈值计算比较分析
图2山东中医药大学与黑龙江中医药大学在中医康复领域发表的科研成果比较
通过对比,我们可以初步判断,在中医康复研究领域,山东中医药大学的硕士和博士论文总数远远超过黑龙江中医药大学,说明在该领域的办学规模上,山中医的办学规模大于黑中医;在中医康复领域发表的学术期刊论文和会议论文数量超过黑中医。中医康复领域的研究人员愿意参加更多的会议并与同行交流,发表了更多的会议论文。黑中医的成果数量是山地中医的近两倍,说明黑中医的科研工作更加注重成果,这方面的实力也更强。
3.1.3 学术指导
通过对研究热点和研究团队现状的分析,为研究人员提供学术指导。如利用VOSviewer等软件,通过分析相关文献的时间分布、期刊分布、学科分布,进行关键词聚类和及时的区域分析,把握研究热点、发展趋势和未来方向。以期在政策引导、科研资助、学术交流等方面提供更好的学术发展环境。
要了解某一领域的研究趋势,可以使用趋势图。以中医康复为主题词,以期刊论文发表年份和数量为变量绘制的趋势图如图3所示。
图3 TCM 康复领域期刊发表数量
从图3可以看出,自2010年以来,中医药康复领域的论文数量快速增长,说明2010年以后,中医药在临床康复治疗中的研究越来越深入,治疗手段越来越多样化,应用越来越广泛,研究成果呈现上升趋势。
通过对文献的可视化定量分析,也可以分析出中医康复治疗的研究热点。可以看出,中医康复的十大重点研究领域依次为脑卒中、临床研究、临床观察、中医护理、康复治疗、中医康复护理、脑卒中后康复训练、临床疗效观察,如图4所示。
图4 中医药康复治疗十大热点研究领域
3.2 人力资源管理
利用图表等可视化方法,不仅可以直观地显示图书馆员各项能力的得分情况,还可以通过设置不同的变量,直观地显示和比较图书馆员的工作量和科研贡献情况。若以业务能力、研究能力、工作态度、沟通能力和学习能力五个维度为A系五名图书馆员打分,结果A(90、80、95、75、85)为图书馆员,B(85、70、85、85、80)为图书馆员,C(90、85、85、85、90)为图书馆员,D(65、40、80、85、60),E(85、60、90、90、80)为图书馆员。单从文字和数字上很难看出差别,需要反复比较。然而,使用雷达图,可以清楚地看到每个图书管理员的长版和短板之间的能力差异,如图5所示。
图5 一个部门五个图书管理员的雷达图
此外,为了评估图书馆员的工作量,可以使用切片机对不同年份、不同部门的个人工作量和科研量进行结果统计,对图书馆员的工作量或科研产出进行阶段性监测和统计分析,并对工作量或学术产出进行可视化显示。
4. 大型视觉屏幕在图书馆中的应用
数据可视化大屏幕显示是将视觉传播学、计算机技术和用户心理学相结合,以大屏幕为显示载体,进行直观、炫酷、科技的显示。在对业务指标进行梳理确定需求后,将定义好的指标信息映射为视觉元素,通过触摸、交互操作或单向信息显示的方式传递给观看者[5]。
视觉图表是非常强大的。柱状图用于显示同一类型的数据随时间的变化,图书馆可视化屏幕可以使用柱状图快速发现图书馆中借出了哪些书以及读者对哪些书更感兴趣。折线图可以用来反映数据随时间的变化和发展趋势。通过折线图,可以发现不同时间段进入博物馆的人数,方便在高峰期调整人流高峰。自习室预约可以清晰的显示整体与局部的关系,清晰的显示自习室座位的使用效率。
5. 图书馆应用中数据可视化面临的挑战
5.1 引进和培训新的图书馆员以迎接人才挑战
做好图书馆数据可视化工作,图书馆员不仅需要了解图书馆的业务,还需要具备数据思维和数据可视化技能。不同类型和结构的多源数据的处理也对图书馆员的专业能力提出了挑战。图书馆产生了大量的借阅数据、用户数据、点击量等数据,并且随着时间的推移,数据的规模在不断扩大,数据变化迅速,且多为流量数据。不仅需要保持单机、外置存储器模型甚至小型计算集群的处理能力,而且在数据采集和分析过程中也要注意数据的质量。合理控制数据不确定性。对图书馆员实时数据分析和数据可视化能力的要求也很高。智能图书馆要求图书馆员具备数据思维、数据分析技术和较高的信息服务素养。传统的图书馆人力资源配置已不能满足新型智能图书馆对馆员素质的要求。在引进相关人才的同时,要重视在职馆员数据可视化服务意识和技能的培养。
5.2 确保视觉信息服务数据库的准确性和安全性
作为可视化技术应用的重要基础,需要保证准确的数据采集,及时将采集到的数据上传到整个系统,并在数据采集过程中注意信息安全,防止数据丢失、身份信息等隐私信息在系统中被盗。在数据可视化设计预处理过程中,采用数据挖掘技术对数据进行规约、提取、清理、集成和转换。通过数据预处理,选择合适的数据源,筛选目标数据。同时需要对数据进行验证,检查数据是否规范,是否存在数据冲突[6]。
5.3 数字图书馆向智慧图书馆转型中的创新服务
数据可视化包括动画交互视图、多维图形、地图等。数据可视化技术为图书馆做好知识服务工作提供了有力的手段。美国常春藤大学图书馆建立了不同特色的数据可视化空间,丰富了可视化表达的手段和方式[7]。为了实现向智慧图书馆的转型,为用户提供更好的知识服务,图书馆需要开发更多的创新服务,从更全球化的角度思考图书馆的运营,并帮助与内部馆员进行合作[8]。为了更好地为用户提供数据可视化服务,需要图书馆的多部门合作,这有助于从全球角度收集和共享数据。通过数据可视化,信息以一种更有利于大脑发现模式或趋势的方式呈现[9]。将以用户为中心的理念融入到图书馆的整个运营过程中,始终坚持以用户为导向,数据连接的设置要准确恰当,简单灵活。操作界面简单易懂,避免了过度连接和无效连接。通过数据的可视化显示,便于图书馆管理人员感知、捕捉、记录、挖掘数据、分析读者需求等手段,提供更加智能化的服务[10]。
6. 图书馆行业数据可视化研究热点及未来发展
对科研文献进行可视化分析,可以发现研究热点和发展趋势。本文以图书馆行业数据可视化的研究热点为例,寻找数据可视化在图书馆行业应用的研究趋势。
6.1 数据源
研究文献源数据库采用中国知网(CNKI),检索范围为学术期刊,检索公式为SU =(“数据可视化”+“图书馆”)。
6.2 研究方法与过程
数据截稿日期设定为2023年6月15日,以数据可视化和图书馆为主题词进行高级检索,获得174篇期刊论文。通过对相关文献的时间分布分析和关键词的聚类分析,本文分为四个阶段研究数据可视化在学术期刊论文领域的应用以及研究热点和未来发展趋势。
在中国知网(CNKI)数据库中搜索发现,最早的数据可视化文献发表于2000年。从2000年1月1日到2008年6月16日,仅有5篇相关的期刊论文,说明这一时期数据可视化在图书馆研究中的应用还处于起步阶段。研究内容属于计算机科学与图书情报学的跨学科研究,研究时间为2008年6月至2023年6月,为期5年。根据时间分为初始发展阶段(2008-2013年)(11篇文章)、发展阶段(2013-2018年)(67篇文章)和繁荣阶段:最近五年,2018-2023年(91篇文章)。
将相关文献的标题、作者、来源和关键词以Endnote格式作为样本数据导出,并使用Vosviewer1.6.19软件进行可视化分析。分析类型选择共现,分析单元选择关键词,计算方法选择全计数,引力选择2,斥力选择0。将聚类分辨率设置为1.00,最小聚类大小设置为1。由于期刊论文数量较少,发芽阶段和初步发展阶段的Term分别设置为1和2。由于期刊论文数量较多,发展阶段和繁荣阶段的Term设为3[11]。
6.3 结果分析
从发表论文数量来看,从萌芽到繁荣阶段,发表论文数量增长迅速,说明研究内容越来越广泛,成果越来越丰富。
2000 - 2023年四个阶段期刊论文研究热点数据可视化结果如图6所示。
数据清洗后数据可视化技术在图书馆应用的四个阶段研究热点对比如表1所示。
在对软件分析结果进行清洗,去掉图书馆、数据可视化等词进行对比后,可以发现数据可视化在图书馆领域应用的研究越来越关注智能图书馆的服务目标[12]。
图6 图书馆应用不同阶段的数据可视化研究热点
胚胎期:2000-2008年。
因为只有5篇文献,即使将term设置为1,这5篇文章也只关注了vb(可视化)、可视化编程和图书信息管理三个热点研究领域。数据可视化作为图书馆学与计算机科学的交叉学科,其应用主要集中在可视化编程、图书馆信息管理,如图书馆馆藏的描述和分类,以及利用可视化显示馆藏的类别分布或某一特定主题的图书数量等方面[13]。使用Excel等软件对用户访问统计和借阅数据进行简单的统计分析。
初期发展阶段:2008-2013年。
在对2008 - 2013年11篇文献的研究中,如果将term设为3,则只能得到数字图书馆、数字挖掘和可视化分析三种共现现象;如果将term设置为1,则可以得到37个分散分布的单词,很难看到热点,因此将term设置为2。在去掉“图书馆”和“数据可视化”两个词后,可以得到“数据挖掘”、“可视化分析”、“知识管理”、“数字图书馆”和“知识图谱”五个共现词。在这个初步的发展阶段,可以看出,通过使用数据挖掘和数据可视化分析,研究已经向数字图书馆的研究方向迈进。在此期间,图书馆开始使用更先进的数据可视化工具进行更复杂的数据分析[14]。它还使用可视化数据分析来揭示用户行为和借阅模式,以帮助图书馆更好地了解用户的需求和需求首选项。
表1 图书馆数据可视化应用不同研究阶段高频词比较
|2000-2008(5件) ||2008-2013(11件) ||2013-2018(67件)| |2018-2023(91件)||
|--|--|--|--|--|--|--|--|
|高频词| 频率 |高频词 |频率| 高频词 |频率| 高频词| 频率|
|vb |1 |数据挖掘 |3 |大数据| 21 |大数据 |27
可视化编程| 1| 视觉分析| 3 |知识地图+引文空间 |14+7 |知识地图| 9
图书馆信息管理| 1 |数字图书馆| 3| 数据挖掘| 8 |数据挖掘| 7|
||| 知识地图| 2 |个性化服务| 3 |文献计量学| 6
||| 知识管理| 2 |内容分析法 |3 |数据服务| 6
||||| 词频统计分析 |3 |智能图书馆| 5
||||| 数字化 |3 |数据读写 |5
||||| 文献传递| 3 |阅读推广 |4
||||| 文献计量学 |3 |数字图书馆| 4
||||| 信息可视化| 3 |关联数据 |4
|||||| |数字人文 |3
发展阶段:2013-2018年。
应用越来越丰富的可视化软件工具开始盛行。Citespace软件和各种知识图谱在研究中被频繁使用。大数据和数据挖掘技术备受关注。随着社交媒体的兴起,社交媒体分析成为一个热门话题。通过对社交媒体数据的可视化分析,图书馆可以了解用户对其服务的看法,并开始关注大数据和机器学习技术在图书馆数据分析中的应用。
繁荣期:2018-2023。
近五年来,大数据得到了更多的关注和挖掘。数据可视化越来越多地用于预测分析和构建用户配置文件。为适应图书馆智能化服务用户的目标,开展了更多的应用研究。通过数据可视化、关联数据挖掘、文献计量技术的广泛应用,图书馆可以预测未来用户的行为和需求,并利用数据可视化进行资源配置、服务优化、政策制定等,进一步优化服务。
6.4 图书馆行业数据可视化应用研究的发展趋势
从计算机科学领域的数据分析技术最初应用到图书馆行业,逐渐到数字图书馆的讨论,随着大量数据可视化软件用于研究,图书馆研究人员将数据可视化技术应用到越来越多的服务领域。数据可视化在图书馆行业应用的研究重点已逐渐从数据分析转向数据服务。图书馆比以往任何时候都更加重视用户数据素养的培养、知识服务的数字化、信息一目了然的可视化、将数字理论和实践引入人文学科的数字人文研究,以及数据挖掘技术可能产生的创新服务和个性化服务的机会[15]。数据可视化技术为用户以数据洞察图书馆知识资源打开了一扇窗口,加快了数字图书馆向智能图书馆的转型进程。
7. 结论
数据可视化技术的应用是智能图书馆转型发展的需要。通过数据可视化,可以在保证信息有效传递的同时,使数据所表达的内容易于理解。通过数据分析,逐步改善和优化图书馆服务环境;进一步提升用户体验;策略根据数据变化时提供的信息周期性地实现。数据驱动的决策正变得越来越重要。在图书馆从“数字化”到“智能化”的过程中,越来越重视利用实时数据可视化等智能化手段,了解细微变化对全局的影响,从而全面整合图书馆内外的信息资源。
参考文献
[1] Ren Ni, Wu Qiong, Li Huiquan. Analysis and Research of data visualization Technology. Electronic Technology and Software Engineering, 2022,No. 234 (16): 180-183. (In Chinese)
[2] Chen Ting, Xu Shengjie, Chen Long et al. Research and Design of Chinese Patent Data Visualization Analysis System. Computer Applications and Software, 2023, 40 (01): 24-29. (In Chinese)
[3] Li Wenqi, Wang Fengxiang, Sun Xianbin et al. Disordered directory data integration and visualization of. Journal of Chinese library, 2023, 49 (01): 82-98. The DOI: 10.13530/ j.carol carroll nkijlis. 2023006.
[4] Bakhshayesh, S.M., Ahmadi, A. and Mohebi, A. (2021), "A new subject-based retrieval and search result visualization approach for scientific digital libraries", The Electronic Library, Vol. 39 No. 4, pp. 572-595. https://doi.org/10.1108/EL-08-2020-0243.
[5] Huang Hao. A brief introduction to the design and implementation of medical data visualization on large screen using Python+Flask+ECharts. Digital technology and applications, 2022, 40 (9): 200-202. The DOI: 10.19695 / j.carol carroll nki cn12-1369.2022.09.60.
[6] Hai-yan ren. Application and development trend in the field of visual data mining research. Journal of digital technology and applications, 2018, 4 (8): 225 + 228, DOI: 10.19695/j. carol carroll nki cn12-1369.2018.08.120.
[7] Yu Defeng. Analysis on data visualization services of Ivy League University libraries. Libraries, 2022,No. 334 (07):79-86+100.
[8] Wang Xiuli, Gao Kai, Jiang Jihong, Yu Jing. The role of reading promotion in Library construction under network environment. China Science and Technology Journal Database Research, 2022 (5): 0179-0182.
[9] Liu Xun, Zhang Yanhua, Zhang Dexiang, Li Jin. A Comprehensive Risk Evaluation Method for Digital Library Construction Based on the Perspective of Project Management. Journal of Qingdao University (Natural Science Edition), 2013, 26 (03): 59-63.
[10]Datig, I. and Whiting, P. (2018), "Telling your library story: tableau public for data visualization", Library Hi Tech News, Vol.35 No. 4, Pp. 6-8. https://doi.org/10.1108/LHTN-02-2018-0008.
[11]Fu Tianxin, ZHANG Qinghua, Liu Chengbin et al. Portraits of big data horizon, the university library users to construct and express visual. Journal of Beijing agricultural college, 2023 ((01): 90-96. The DOI: 10.19444 / j.carol carroll nki. 1671-7252.2023.01.011.
[12]HE Bin, QIN Fuqiang, FENG Juan. How to improve the readership of weibo public number of science and technology journals--Taking Journal of Qingdao University (Natural Science Edition) as an example. Science and Technology Communication, 2021, 13 (16).
[13]Ad Hoc Column of Journal of Qingdao University (Natural Science Edition)--Construction of Complete Domestic Demand System and High-Quality Economic Development. Journal of Qingdao University (Natural Science Edition), 2021, 34 (02).
[14]Gao Kai, Yang Zongling. Research on the Innovation of College Library Management and Service Mode in the Information Age-Recommended Readings of College Library Management and Innovative Practices. Intelligence Theory and Practice, 2023, 46 (06): 206.
[15]Qin Fuqiang, Shi Qiaoling. Division of Trade and Cooperation between China and the Five Central Asian Countries in the Background of "Belt and Road" — Based on trade-related index analysis. Journal of Qingdao University (Natural Science Edition), 2016, 29 (02): 128-132.