基于Python的大数据分析实战篇(一)

简介: 基于Python的大数据分析实战篇(一)

☀前言:

       Hello,大家好!我又回来了,下面我将给大家讲解一下,关于我们Python大数据分析的实战测试,希望大家可以在发现错误后,提出意见,我将立刻做出修改。🙇‍

首先,1、Python数据分析流程及学习路径

Python数据分析的流程概括起来主要是:读写、处理计算、分析建模和可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。

2、利用Python读写数据

3、利用Python处理和计算数据

在第一步和第二步,我们主要使用的是Python的工具库NumPy和pandas。其中,NumPy主要用于矢量化的科学计算,pandas主要用于表型数据处理。

4、利用Python分析建模

5、利用Python数据可视化

以上就是关于Python数据分析的简单介绍,下面步入正题!

🐒#1、利用所学知识将文件中的学生成绩信息导入到二维结构中。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df


关于路径问题,推荐选择绝对路径,并且注意  /  的使用即可

🐒#2、使用numpy求数学的平均分。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df
df.iloc[:,7:8]
math=df.iloc[0:99,7:8]
print(math)
print("数学的平均分: ")
math.mean()

 

🐒#3、使用numpy求大学英语的中位数成绩。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df
df.iloc[:,5:6]
english=df.iloc[:,5:6]
print(english)
print("英语的中位数: ")
print(np.median(english))

🐒#4、使用numpy找出所有有不及格科目的学生。

import numpy as np
import pandas as pd
df = pd.read_excel('E:/18级信息管理第一学期智育成绩.xlsx','Sheet1')
df.loc[(df['C语言程序设计A']<60)|(df['计算机应用技术基础A']<60)|(df['大学英语A1']<60)|(df['Python程序设计C']<60)|(df['数学A1']<60),
       ['学号','姓名']]

🏔结语:

🙀写到此处,我们的Python数据分析实战第一篇就暂时结束了!对于后面不足的内容,在接下来的一段时间内将进行补充,请大家多多支持!🙇‍

如果发现内容问题,希望可以评论留言(ง •_•)ง

相关文章
|
5月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
623 7
|
5月前
|
存储 分布式计算 大数据
基于Python大数据的的电商用户行为分析系统
本系统基于Django、Scrapy与Hadoop技术,构建电商用户行为分析平台。通过爬取与处理海量用户数据,实现行为追踪、偏好分析与个性化推荐,助力企业提升营销精准度与用户体验,推动电商智能化发展。
|
5月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
5月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
5月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
6月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
425 14
|
7月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
496 0

推荐镜像

更多