python数据分析之高校考试监考安排

简介: python数据分析之高校考试监考安排

又到了学期的期末了,开始了每学期的监考工作。考试监考虽然是一件小事,但是如果因为某些失误而缺席,将会被认定为一次教学事故,后果非常严重,因此学校内每位老师都非常的重视。


学校每到期末的时候,都会发一份学校监考安排的Excel表格,今年也不例外。无奈由于我的系统是mac,安装了非正版的office软件,且打开数据量非常大的Excel文件速度变得非常慢,另外本人对Excel的操作实在是很糟糕,于是乎用python完成了简单的数据分析,最后发现效果还是非常不错的,摈弃了复杂的Excel可视化操作,完全采用python的方式来得到结果,并且得到了有意思的一些分析结果。


0 读入Excel文件


利用pandas读入监考安排的Excel文件,为下一步数据分析做准备。由于pandas在读取excel文件的时候依赖了xlrd库,因此需要先通过conda安装该库。


conda install xlrd  



1 数据预处理


由于人工在编辑Excel文件的时候,会人为的出现一些空格等字符,因此需要对每一个字段进行去空格的预处理。


2 查询我的监考


通过python可以快速的查看到自己的监考信息,相比使用复杂的Excel操作,我更喜欢命令行的方式来操作。


在快速找到自己的监考安排后,我很想知道其他老师的监考是怎么样的?会不会比我少?还是比我多呢?


3 所有老师监考数量分布


此处代码较多,不方便贴出所有的代码,只是给出最终的分布。

横轴是本次期末每位老师监考的总场次,分别为1-5,最少的一场,最多的需要监考五场。纵轴是监考N场的老师的数量,如本学期只需要监考一场的老师有两位,两场的老师有23位,依次类推。


从分布来看,大多数老师期末监考还是安排在五场,行政岗位的老师平均在两场,当然还有一些老师的场次是比较少的。


4 课程考试分布



5 考场分布

横轴是一门课程需要的考场数量,纵轴是课程数量。如有20门课程只需要一个考场,34门课程需要两个考场,36门课程需要三个考场,以此类推。

其实课程的考场数量就是课程的班级,一门课程的班级越多,考场也就越多。从上图分布可以看出,大部分课程应该在两三个班,当然也存在一些课程班级特别多的,如《大学英语(4)》就达到了50个班,《大学英语(3)》有49个班,大学计算机的班级也是相当多的,如《大学计算机(非计算机专业)》班级数量有24个,数学类的课程班级也比较多,如线性代数达到了22个班。通识课、公共课的课程是所有专业的必修课,因此考场的分布也相当多,大部分专业课程的考场都集中在2~3个。

6 总结

本文通过python对某高校的监考安排做了分析,并得出教师监考场次的分布、课程分布和考场分布等情况。基于python的数据分析,相比于其他的可视化软件如Excel等具有无可比拟的优势。


目录
相关文章
|
4天前
|
数据挖掘 Python
python数据分析常用图大集合
python数据分析常用图大集合
|
6天前
|
数据可视化 数据挖掘 知识图谱
精选:15款顶尖Python知识图谱(关系网络)绘制工具,数据分析的强力助手
这里有15款免费工具推荐:NetworkX(Python基础),Graph-tool(C++速度),Graphviz(可视化库),ipycytoscape(Jupyter集成),ipydagred3,ipySigma(NetworkX + Web),Netwulf(交互式),nxviz(Matplotlib绑定),Py3plex(复杂网络分析),Py4cytoscape(Python+Cytoscape),pydot(Graphviz接口),PyGraphistry(GPU加速),python-igraph,pyvis(交互式图形),SNAP(大规模网络分析)。绘制和理解网络图从未如此简单!
17 0
|
7天前
|
机器学习/深度学习 自然语言处理 数据挖掘
使用Python和大模型进行数据分析和文本生成
Python语言以其简洁和强大的特性,成为了数据科学、机器学习和人工智能开发的首选语言之一。随着大模型(Large Language Models, LLMs)如GPT-4的崛起,我们能够利用这些模型实现诸多复杂任务,从文本生成到智能对话、数据分析等等。在这篇文章中,我将介绍如何用Python连接和使用大模型,并通过示例展示如何在实际项目中应用这些技术。
|
10天前
|
数据采集 机器学习/深度学习 数据可视化
利用Python和Pandas库构建高效的数据分析流程
在数据驱动的时代,数据分析已成为企业决策的关键环节。本文介绍如何利用Python编程语言及其强大的数据分析库Pandas,构建一套高效且可扩展的数据分析流程。与常规的数据分析流程不同,本文不仅涵盖数据加载、清洗、转换等基础步骤,还强调数据可视化、模型探索与评估等高级分析技巧,并通过实际案例展示如何在Python中实现这些步骤,为数据分析师提供一套完整的数据分析解决方案。
|
11天前
|
机器学习/深度学习 数据采集 数据可视化
使用Python进行数据分析涉及数据收集
【6月更文挑战第21天】使用Python进行数据分析涉及数据收集(如数据库、文件、API),数据清洗(处理缺失值、异常值和重复项),数据探索(统计摘要、可视化和相关性分析),特征工程(创建新特征和编码),模型构建(选择算法、训练与调整),模型评估(计算指标、可视化效果),结果解释(报告和可视化),以及部署与维护。此过程因项目需求而异,可能需迭代。常用库有`pandas`、`requests`、`BeautifulSoup`、`Matplotlib`等。
20 1
|
13天前
|
数据采集 数据可视化 数据挖掘
Python数据分析入门指南
Python数据分析涉及环境搭建(推荐Anaconda,含pandas和matplotlib库)。使用`pandas`读取CSV数据,如`data = pd.read_csv('data.csv')`。数据清洗包括检查缺失值(`data.isnull().sum()`)和处理异常值。然后进行数据处理,如创建新列、选择特定列及分组。利用`matplotlib`进行数据可视化,绘制直方图和散点图,以`plt.hist()`和`plt.scatter()`展示数据。
|
14天前
|
索引 Python
Python考试基础知识
Python考试基础知识
13 1
|
15天前
|
机器学习/深度学习 人工智能 算法框架/工具
Python赋能AI数据分析
Python赋能AI数据分析
29 0
|
1天前
|
Java UED Python
Python多线程编程实战技巧与性能优化策略
Python多线程编程实战技巧与性能优化策略
|
4天前
|
设计模式 程序员 测试技术
老程序员分享:Python数据模型及Pythonic编程
老程序员分享:Python数据模型及Pythonic编程
16 1