对中国知网搜索结果进行批量定制并制成Excel的方法

简介:       为避免误会,首先声明本文前提是有合法访问身份,博文利用校园网包库形式进行登陆。PS:如果有人想问有没有外网免费访问方式呢?答案:有。请社工,然后SSL,当然这是不合情理的请大家别用,该话题点到为止,接下来转入正题。
 
    为避免误会,首先声明本文前提是有合法访问身份,博文利用校园网包库形式进行登陆。PS:如果有人想问有没有外网免费访问方式呢?答案:有。请社工,然后SSL,当然这是不合情理的请大家别用,该话题点到为止,接下来转入正题。
 
    中国知网是目前国内最大最全的综合期刊网,也是专家学者使用量最大的专业学术网站。由于近期的大研究任务需要对某杂志特定按年份进行梳理,而且第一个子任务只关心论文题目,还要保证千万不能出现作者或作者单位这样有可能影响我们判断的因素。因此,如何搜索、如何可仅得到论文题目,然后处理成格式正确可统计处理的Excel表,这便是本博文的内容。
 
    当然,第一步就是进入期刊网,并选择“来源期刊检索”,设置年份,进行搜索:
img_1d9d183371bc828527bb6b4fbc4de36c.jpg
 
    选择你想要的文献,再点击“导出、分析...”进入下图:
img_39878f0ba7dd484b9504a6831da59d94.jpg
 
    接下来,很简单,全选后点击“导出/参考文献”,如上图所示。在随后出现的页面中,仍然要进行几步操作:1、自定义格式;2、选择输入内容;3、输出到TXT文件,虽然具有复制到剪切板功能,但通过我的验证这个功能目前截止发稿时无法使用。
img_0f55071e6d5c560022c88c9c5ef7b639.jpg
   
    然后,打开这份TXT文件,把里面的所有内容复制到Excel中,如下图所示:
 
img_00042eb375bdc5751b3c597283da0ba6.jpg
 
    当然,这并不是我们最后想要的格式,于是我们应该做两件事:一是把“Title题名”去掉,二是把空行去掉。具体做法如下:
 
img_35781c7ead12496d95b30f5053954ab7.jpg
 
    用快捷键Ctrl+F弹出“查找和替换”,全部替换即可,注意替换为选项内容为空。
img_24db4f238bf085be4d96e684cdc15f16.jpg
 
    紧接着,选中A列,在数据选项卡中点击“删除重复项”,随后弹出的对话框直接确定就好。
img_fe515300a307bf373e5dd46b8375a323.jpg
 
    由于删除的是重复空行,因而第一个空行并未视作重复项,才保留了下来。将其删除掉。
 
img_2e9d209d05b3df7ce4dc1fe95d06ebfc.jpg
   
    至此,全部完成,得到了只有论文名的Excel表!希望对大家有帮助。
 
 
 
相关文章
|
7月前
|
存储 数据可视化 数据处理
Python中读取Excel文件的方法
【2月更文挑战第18天】
305 4
Python中读取Excel文件的方法
|
7月前
|
存储 数据处理 索引
Python操作Excel常用方法汇总
Python操作Excel常用方法汇总
273 0
jsp页面中显示word/excel文档方法
jsp页面中显示word/excel文档方法
156 0
VS2005(excel2007)利用Automation(OLD Automation)方法。将Excel当成组件服务器的编译错误 我的系统盘和office都装在d盘。 自动生成的import有问题
VS2005(excel2007)利用Automation(OLD Automation)方法。将Excel当成组件服务器的编译错误 我的系统盘和office都装在d盘。 自动生成的import有问题
|
2月前
|
数据处理 Python
Python 高级技巧:深入解析读取 Excel 文件的多种方法
在数据分析中,从 Excel 文件读取数据是常见需求。本文介绍了使用 Python 的三个库:`pandas`、`openpyxl` 和 `xlrd` 来高效处理 Excel 文件的方法。`pandas` 提供了简洁的接口,而 `openpyxl` 和 `xlrd` 则针对不同版本的 Excel 文件格式提供了详细的数据读取和处理功能。此外,还介绍了如何处理复杂格式(如合并单元格)和进行性能优化(如分块读取)。通过这些技巧,可以轻松应对各种 Excel 数据处理任务。
251 16
|
3月前
|
存储 数据挖掘 测试技术
Python接口自动化中操作Excel文件的技术方法
通过上述方法和库,Python接口自动化中的Excel操作变得既简单又高效,有助于提升自动化测试的整体质量和效率。
42 0
|
5月前
|
存储 开发工具 git
好的git管理方法,标明项目_编号_(功能,不过还是在没有bug出现时就提交为好)+Excel表管理的格式
好的git管理方法,标明项目_编号_(功能,不过还是在没有bug出现时就提交为好)+Excel表管理的格式
|
7月前
|
文字识别
分享:如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用,图片批量识别转excel表格的方法
该软件是一款OCR身份证识别工具,能批量处理图片,自动提取身份证信息并导出为Excel。支持百度网盘和腾讯云盘下载。用户界面直观,操作简单,适合新手。识别过程包括:打开图片、一键识别、导出结果。特别注意,此程序仅适用于身份证识别,不适用于其他类型的图片识别。
286 1
分享:如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用,图片批量识别转excel表格的方法
|
数据处理 Python
在Python中处理Excel文件有很多方法
在Python中处理Excel文件有很多方法
136 1