第40天:Python statistics 模块

简介: 第40天:Python statistics 模块

简介

随着互联网的普及,整个互联网每天都会产生海量的数据,如何有效地处理这些数据成为了互联网人的必备技能,而 Python 内置的 statistics 模块提供了基本的数据统计操作。

常用功能

mean(data)

mean(data) 用于求给定序列或者迭代器的算术平均数。


import statisticsexample_list = [1,2,3,4,5,6]x = statistics.mean(example_list)print(x)
# 输出结果3.5


harmonic_mean(data)


harmonic_mean(data) 用于计算数据的调和均值。


x = statistics.harmonic_mean(example_list)print(x)print(1/sum([1/1,1/2,1/3,1/4,1/5,1/6])*6)
# 输出结果2.44897959183673472.448979591836735


median(data)


median(data) 计算数据的中位数。如果有两个中位数,则返回其平均值


x = statistics.median(example_list)print(x)
# 输出结果3.5


median_low(data)


median_low(data) 也是用于计算中位数的,如果有两个中位数,返回较小的那个。


x = statistics.median_low(example_list)print(x)
# 输出结果3


median_high(data)


median_high(data) 也是用于计算中位数的,如果有两个中位数,返回较大的那个。


x = statistics.median_high(example_list)print(x)
# 输出结果4


mode(data)


mode(data) 计算众数,也就是序列中出现次数最多的元素。



x = statistics.mode([1,1,2,3,4,3,3,3,3])print(x)
x = statistics.mode(["a","b","c","d","d","a","a",])print(x)
# 输出结果3a


pstdev(data, mu=None)


pstdev(data, mu=None) 用于计算数据的总体标准差。其中 mu 是序列的均值,如果你已经知道了该序列的均值,可传入该参数以减少计算量,当然该函数不会去验证你传入的均值是否合法,使用错误的均值可能会产生无效的结果。



x = statistics.pstdev([2,2,2,6])print(x)
# 输出结果1.7320508075688772


pvariance(data, mu=None)


pvariance(data, mu=None) 用于计算数据的总体方差。


x = statistics.pvariance([2,2,2,6])print(x)
# 输出结果3


stdev(data, xbar=None)


stdev(data, xbar=None) 用于计算数据的样本标准差。其中 xbar 是序列的均值,如果你已经知道了该序列的均值,可传入该参数以减少计算量,当然该函数不会去验证你传入的均值是否合法,使用错误的均值可能会产生无效的结果。


x = statistics.stdev([2,2,2,6])print(x)
# 输出结果2.0


variance(data, xbar=None)


variance(data, xbar=None) 用于计算数据的样本方差。


x = statistics.variance([2,2,2,6])print(x)
# 输出结果4

statistics 总结

本文总结了 statistics 模块的常规操作,对于数据分析还是非常有益处的。

示例代码:Python-100-days-day040

参考资料

https://docs.python.org/zh-cn/3.7/library/statistics.html


系列文章

  第39天:Python itertools 模块   第38天:Python decimal 模块

  第37天:Python math 模块

  第36天:Python calendar 模块   第35天:pathlib 模块   第34天:Python json&pickle

  第33天:Python 枚举

   第32天:Python logging 模块详解        

   第31天:Python random 模块详解    

   第30天:Python collections 模块详解

   第29天:Python queue 模块详解

   第28天:Python sys 模块详解

   第27天:Python shutil 模块

   第26天:Python os 模块详解

   第25天:Python datetime 和 time

   第24天:Python Standard Library 02

   第23天:Python Standard Library 01

   第22天:Python NameSpace & Scope

   第21天:Web开发 Jinja2模板引擎

   第0-20天:从 0 学习 Python 0-20 天合集

目录
相关文章
|
25天前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
42 4
|
5天前
|
Python
Python Internet 模块
Python Internet 模块。
100 74
|
23天前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
104 63
|
24天前
|
测试技术 Python
手动解决Python模块和包依赖冲突的具体步骤是什么?
需要注意的是,手动解决依赖冲突可能需要一定的时间和经验,并且需要谨慎操作,避免引入新的问题。在实际操作中,还可以结合使用其他方法,如虚拟环境等,来更好地管理和解决依赖冲突😉。
|
24天前
|
持续交付 Python
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。
|
1月前
|
JSON Linux 数据格式
Python模块:从入门到精通,只需一篇文章!
Python中的模块是将相关代码组织在一起的单元,便于重用和维护。模块可以是Python文件或C/C++扩展,Python标准库中包含大量模块,如os、sys、time等,用于执行各种任务。定义模块只需创建.py文件并编写代码,导入模块使用import语句。此外,Python还支持自定义模块和包,以及虚拟环境来管理项目依赖。
Python模块:从入门到精通,只需一篇文章!
|
25天前
|
Python
Python的模块和包
总之,模块和包是 Python 编程中非常重要的概念,掌握它们可以帮助我们更好地组织和管理代码,提高开发效率和代码质量
37 5
|
24天前
|
数据可视化 Python
如何在Python中解决模块和包的依赖冲突?
解决模块和包的依赖冲突需要综合运用多种方法,并且需要团队成员的共同努力和协作。通过合理的管理和解决冲突,可以提高项目的稳定性和可扩展性
|
1月前
|
Python
在Python中,可以使用内置的`re`模块来处理正则表达式
在Python中,可以使用内置的`re`模块来处理正则表达式
46 5
|
1月前
|
Java 程序员 开发者
Python的gc模块
Python的gc模块
下一篇
DataWorks