开发者社区> 华章计算机> 正文

《Python数据分析与挖掘实战》一3.4 小结

简介:
+关注继续查看

本节书摘来自华章出版社《Python数据分析与挖掘实战》一书中的第3章,第3.4节,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区“华章计算机”公众号查看

3.4 小结

本章从应用的角度出发,从数据质量分析和数据特征分析两个方面对数据进行探索分析,最后介绍了Python常用的数据探索函数及用例。数据质量分析要求我们拿到数据后先检测是否存在缺失值和异常值;数据特征分析要求我们在数据挖掘建模前,通过频率分布分析、对比分析、帕累托分析、周期性分析、相关性分析等方法,对采集的样本数据的特征规律进行分析,以了解数据的规律和趋势,为数据挖掘的后续环节提供支持。
要特别说明的是,在数据可视化中,由于主要使用Pandas作为数据探索和分析的工具,因此我们介绍的作图工具都是Matplotlib和Pandas结合使用。一方面,Matplotlib是作图工具的基础,Pandas作图依赖于它;另一方面,Pandas作图有着简单直接的优势,因此,两者相互结合,往往能够以最高的效率作出符合我们需要的图。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
躬身入局,干货分享,2023年春招后端技术岗(Python)面试实战教程,Offer今始为君发
早春二月,研发倍忙,杂花生树,群鸥竟飞。为什么?因为春季招聘,无论是应届生,还是职场老鸟,都在摩拳擦掌,秣马厉兵,准备在面试场上一较身手,既分高下,也决Offer,本次我们打响春招第一炮,躬身入局,让2023年的第一个Offer来的比以往快那么一点点。
27 0
Python 实战项目解决循环依赖问题
Python 模块间可以随意引用,但是必须注意实例化的前后顺序,否则就会出现这种循环实例化问题,让人摸不着头脑。
23 0
机器学习实战_初识朴素贝叶斯算法_理解其python代码(二)
机器学习实战_初识朴素贝叶斯算法_理解其python代码(二)
33 0
机器学习实战_初识朴素贝叶斯算法_理解其python代码(一)
机器学习实战_初识朴素贝叶斯算法_理解其python代码(一)
43 0
机器学习实战_初识决策树(ID3)算法_理解其python代码(二)
机器学习实战_初识决策树(ID3)算法_理解其python代码(二)
46 0
机器学习实战_初识决策树算法_理解其python代码(一)
机器学习实战_初识决策树算法_理解其python代码(一)
50 0
机器学习实战_初识kNN算法_理解其python代码
机器学习实战_初识kNN算法_理解其python代码
55 0
虚言妙诀终虚见,面试躬行是致知,Python技术面试策略与技巧实战记录
2023年,对于正在找工作的朋友来说,今年的就业季显得更加具有挑战性,更有意思的是,每当这个时候,各种面试经验分享就如同过江之鲫一般,俯拾皆是,因为例子过多,兹不细举。然而这些面试经验大部分都停留在理论阶段,这就造成了一个问题:理论和实际,到底有多大出入?我国古代大名仕曾文正公曾经说:“天下事,在局外呐喊议论,总是无益,必须躬身入局,挺膺负责,方有成事之可冀。”革命先烈李大钊先生也曾感叹:“凡事都要脚踏实地去作,不驰于空想,不骛于虚声,而惟以求真的态度作踏实的工夫。以此态度求学,则真理可明,以此态度做事,则功业可就。”所以本次我们来进行一次真实的线上面试,正所谓空谈误国,实干兴邦,能够检验真理
24 0
文章
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
用SQL做数据分析
立即下载
基于英特尔®FPGA的数据分析可重构加速
立即下载
SAS数据分析开发之道:软件质量的维度
立即下载