40000+条考研信息数据可视化(学校、专业分数分布)

简介: 40000+条考研信息数据可视化(学校、专业分数分布)

大家好,我是欧K~

考研刚刚结束,本期我们通过分析各大高校考研招生信息数据,看看:

  • 招生专业最多的10大高校是哪些
  • 分数最高的15大专业
  • 专业最高分、最低分分布情况
  • 几大专业专业TOP20学校有哪些
  • 其他

涉及到的库:Pandas — 数据处理Pyecharts — 数据可视化

可视化部分:

柱状图 — Bar象形图 — PictorialBar组合组件 — Grid词云图 — stylecloud


1. 导入模块

升级 pyecharts 包:

可视化部分需要用到 pyecharts==1.9.0,已安装其他低版本的需要升级,如果未安装过pyecharts,直接pip安装就是最新版本。

import re
import stylecloud
from PIL import Image
import numpy as np
import pandas as pd
from pyecharts.charts import Line,PictorialBar,Bar,Grid
from pyecharts import options as opts
from pyecharts.globals import ThemeType
from pyecharts.globals import SymbolType
from pyecharts.commons.utils import JsCode


2. Pandas数据处理

2.1 读取数据

df = pd.read_csv('考研信息.csv')
df.head(10)



2.2 查看索引、数据类型和内存信息

df.info()


一共有44931条专业招生信息,学校名称、院系名称、专业代码列存在部分缺失值。

2.3 过滤空行

df.dropna(inplace=True)


2.4 筛选2020年考研信息

df_2020 = df[df['年份'] == 2020]
df_2020.info()

2020年一共有17394专业招生信息。

2.5 查看某些列重复的行

这里我们以学校名称和专业代码列为例:

df_2020.duplicated(subset=["学校名称","专业代码"]).sum()


3. Pyecharts可视化

3.1 招生专业最多的10大高校

武汉大学吉林大学以超过200个研究生招生专业排名前两位,厦门大学西南大学以180+专业数量分列第三、第四位,北京大学四川大学山东大学复旦大学紧随其后,云南大学排名第九,南开大学以141个招生专业挤进前十。此外,招生专业前十的学校中,双一流(985/211)学校占8所非双一流(211)为2所(西南大学、云南大学)。3.2 开设专业数量排名

df_2020['专业名称'].value_counts()[:15].to_frame('数量')


从开设专业数量角度来看:计算机科学与技术、(专业学位)工商管理、(专业学位)会计、管理科学与工程、(专业学位)金融、(专业学位)法律(非法学)、(专业学位)法律(法学)、材料科学与工程、(专业学位)公共管理、机械工程、数学、(专业学位)英语笔译、设计学、统计学、环境科学与工程等专业的研究生招生学校比较多。3.3 总分要求最高的15大专业

从分数要求来看:语言学及应用语言学、法语语言文学、社会保障教育经济与管理、日语语言文学、公共关系学、心理学、国民经济学、比较教育学、土地资源管理、中国语言文学、工业设计、语言学及应用语言学、中国现当代文学、日语语言文学等专业总分要求比较高,均在400分以上(总分500)。3.4 部分专业最高分、最低分分布

以专业数量较多的前15个专业为例:

按招生专业的平均分排序,可以看出:金融信息工程、高分子材料科学与工程、金融服务法、法学、经济数学等学科的分数要普遍更高一些,最高分在380分以上,最低分在340左右3.5 计算机科学与技术专业TOP20学校

'清华大学', '北京航空航天大学', '东北大学', '湖南大学', '北京理工大学', '广东工业大学', '华南师范大学','大连海事大学', '华南理工大学', '四川大学', '上海交通大学', '中国科学技术大学', '东华大学', '北京科技大学', '中南财经政法大学','哈尔滨工程大学', '浙江大学', '哈尔滨工业大学', '重庆大学', '苏州大学'

3.6 管理科学与工程专业TOP20学校

'苏州大学', '东北大学', '华中科技大学', '清华大学', '武汉理工大学', '西南交通大学','华南理工大学','湖南大学', '暨南大学', '河北工业大学', '北京理工大学', '武汉大学', '北京航空航天大学', '南京航空航天大学','南京理工大学', '东南大学', '清华大学', '厦门大学', '北方工业大学', '北京工业大学'

3.7 会计专业TOP20学校

'北京科技大学', '中国海洋大学', '对外经济贸易大学', '暨南大学', '武汉大学', '北京交通大学', '东南大学','南京航空航天大学', '南京大学', '厦门大学', '中国矿业大学', '中国农业科学院', '西南交通大学','中国人民大学', '吉林大学', '南开大学', '江西财经大学', '上海大学', '江苏大学', '山东大学'

3.8 工商管理专业TOP20学校

'湖南大学', '华中科技大学', '北京理工大学', '武汉理工大学', '东南大学', '郑州大学','河北工业大学','上海交通大学', '河北师范大学', '东北大学', '重庆大学', '东华大学','复旦大学', '深圳大学', '江南大学','清华大学', '合肥工业大学', '哈尔滨工业大学', '天津大学', '中山大学'

3.9 法律专业TOP20学校

'四川大学', '武汉大学', '南开大学', '武汉大学', '中国政法大学', '中国政法大学', '对外经济贸易大学','浙江大学', '浙江大学', '中国人民大学', '南开大学', '吉林大学', '吉林大学', '吉林大学', '复旦大学', '武汉大学', '华南理工大学', '西南大学', '中南财经政法大学', '甘肃政法学院'


3.10 材料科学与工程专业TOP20学校

'安徽工程大学', '北京航空航天大学', '上海交通大学', '武汉理工大学', '北京科技大学', '东北大学','北京理工大学', '中南大学', '重庆大学', '哈尔滨工业大学', '西南交通大学', '华南理工大学', '天津大学','东南大学', '苏州大学', '湖南大学', '同济大学', '武汉大学', '南京大学', '郑州大学'


3.11 机械工程专业TOP20学校

'华中科技大学', '西南交通大学', '北京航空航天大学', '上海交通大学', '湖南大学', '湖北师范大学','北京工业大学', '重庆大学', '中南大学', '哈尔滨工业大学', '哈尔滨工程大学', '南京航空航天大学', '东北大学','江苏大学', '北京理工大学', '同济大学', '北京科技大学', '中国矿业大学', '中国科学技术大学', '华东理工大学'


3.12 词云图

pic_name = '学校名称.png'
stylecloud.gen_stylecloud(
    text=' '.join(s_list),
    font_path=r'STXINWEI.TTF',
    palette='cartocolors.qualitative.Bold_5',
    max_font_size=100,
    icon_name='fas fa-yen-sign',
    background_color='#212529',
    output_name=pic_name,
    )


学校名称词云


专业名称词云

篇幅原因,部分代码未展示,如果需要可在下方获取,也可在线运行(含全部代码)

https://www.heywhale.com/mw/project/61dd05963debcb0022df70ab

END


以上就是本期为大家整理的全部内容了,赶快练习起来吧,如果需要数据文件,可以联系小编获取喜欢的朋友可以点赞、点在看也可以分享让更多人知道

相关文章
|
3月前
|
存储 数据可视化 数据挖掘
【python】Python考研分数 线性回归模型预测(源码+论文)【独一无二】
【python】Python考研分数 线性回归模型预测(源码+论文)【独一无二】
|
5月前
计算机网络——物理层相关习题(计算机专业考研全国统考历年真题)
计算机网络——物理层相关习题(计算机专业考研全国统考历年真题)
47 0
考研专业课程管理系统 毕业设计 JAVA+Vue+SpringBoot+MySQL(二)
考研专业课程管理系统 毕业设计 JAVA+Vue+SpringBoot+MySQL
|
Java 测试技术 数据库
考研专业课程管理系统 毕业设计 JAVA+Vue+SpringBoot+MySQL(一)
考研专业课程管理系统 毕业设计 JAVA+Vue+SpringBoot+MySQL
|
机器学习/深度学习 人工智能 算法
大数据专业适合考研吗?
大数据专业目前是构架在计算机、统计学、数学之上的应用学科不假,但是其本身也有很多值得提升的地方,是大学四年所不能完全cover的,即便是cover到的地方,也不够精深。
2652 0
|
大数据
大数据时代,应用统计学专业成考研香饽饽
大数据时代是现代生产力水平发展到一定阶段的必然产物。数据不断产生,而且越来越多。尽管当今“大数据”潮流让我们获得了海量数据,但掌握这些海量数据本身并无意义,真正的意义体现在对数据信息进行专业化的处理。
1303 0
|
Web App开发
数学专业考研考博试题荟萃(更新至2017年)
只有部分才做了解答, 请见: http://www.cnblogs.com/zhangzujin/p/3527416.html   华东师范大学2017年高等代数考研试题   华东师范大学2017年数学分析考研试题   浙江大学2017年数学分析考研试题   浙江大学2015年数学分...
1371 0
数学专业考研试题目录
南京师范大学2014年高等代数考研试题   宁波大学2014年高等代数考研试题 宁波大学2014年数学分析考研试题   西南大学2012年高等代数考研试题 西南大学2012年数学分析考研试题   中国科学技大学2014年线性代数与解析几何考研试题 中国科学技大学2014年数学分析考...
756 0
|
Perl
[再寄小读者之数学篇](2014-04-20 [苏州大学数学专业考研复试试题] 解析函数有特定表达式的一个充分条件)
设 $f$ 在 $D=\sed{z\in\bbC;\ |z|\leq 1}$ 上除点 $z_0\in D$ 外处处解析, 且满足 (1) 在 $D$ 内 $f$ 没有零点; (2) $z\in \p D\ra f(z)\in \p D$; (3) $z_0$ 是 $f$ 的一阶极点.
626 0
数学专业考研及读研目录[2014年11月7日更新]
数学分析 [数学分析高等代数考研试题官方下载地址] (没有pdf) 函数 存在无穷多个函数, 其复合为恒等函数 有限无界函数 对数不等式 平均值不等式 单调函数的一个充分条件 自然数集到自身的两个不可交换的双射   极限 数列极限的存在性 非线性递归数列的敛散性 导数组...
1581 0

热门文章

最新文章