说到近年来受欢迎的语言,那肯定有python,python为什么这么火呢?
其中一个重要原因就是因为Python的库丰富——Python语言提供超过15万个第三方库,Python库之间广泛联系、逐层封装。几乎覆盖信息技术所有领域,下面简单介绍下数据分析与可视化、网络爬虫、自动化、WEB开发、机器学习常用的一些第三方库。有了这些库,我们就不可以不用造轮子了。
一、数据分析和可视化
这对于一些大公司来说,分析数据,然后做成可视化图表这是很有用的。什么柱状图,饼状图,这些都可以用库生成,直接导入数据就行了。
1numpy
numPy是Python科学计算的基础工具包,包括统计学、线性代数、矩阵数学、金融操作等等很多Python数据计算工作库都依赖它。支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
2pyecharts
Pyecharts是一个用于生成 Echarts 图表的类库。
3matplotlib
NumPy是Python科学计算的基础工具包,包括统计学、线性代数、矩阵数学、金融操作等等很多Python数据计算工作库都依赖它。支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。你会在很多地方都见到他的身影。
4plotly
Plotly一个开源的、交互式的、基于浏览器的 Python 图形库,支持散点图、3D图等众多图形。
二、网络爬虫
1Scrapy
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。这个比较常见应该很多人都听过。
2PySpider
pyspider 是一个用python实现的功能强大的网络爬虫系统,能在浏览器界面上进行脚本的编写,功能的调度和爬取结果的实时查看,后端使用常用的数据库进行爬取结果的存储,还能定时设置任务与任务优先级等。
1requests
网络请求库,提供多种网络请求方法并可定义复杂的发送信息,对HTTP协议进行高度封装,支持非常丰富的链接访问功能。
有了上面的库,你们平时做爬虫,然后把爬到的数据进行有效的数据分析,那就简单很多了。如果有想深入学习爬虫的也可以关注公众号:诗一样的代码,找我一起学。