
若要独立用 Python 处理数据科学问题,Pandas 是绕不过去的。
新番
今天,花了一上午的时间,跟着这个 Youtube 系列教程,学习了 Pandas 中级技巧。

视频来自于 Data School。发布者是 Kevin Markham 。

在这个系列视频教程里, Kevin 将自己的 PYCON 2018 workshop 分成了10个部分全部精剪后释出。一步步带你领略 Pandas 的魅力。
我用了2个多小时,完成了他10个视频的全部内容。
收获颇丰。
利用教程中提到的美国交通警务数据来自于斯坦福开放警务项目(THE STANFORD OPEN POLICING PROJECT)。

这是数据大概的样子:

一步步按照 Kevin 的指令练习,你可以完成这些内容:
分析男女司机的交通违规都包括哪些类别?每一类占比如何?

那些被搜查车辆的男女司机,各是由于什么原因?

哪个时段,警察发现违规的数量最多?

不同违规行为里,司机年龄是如何分布的?

这些分析结果,只是这个教程的一小部分而已。
更妙的是,上述这些图形,几乎都是利用两三条 Pandas 语句,就可以做出。有的只需要一条就可以。
怎么样?有没有想学习的冲动?
教程与 ipynb 文件,都可以从这个github repo下载。

安装好 Anaconda 3之后,你就可以打开一个 Jupyter Notebook,跟着视频一起做了。
老友
说说我是怎么找到这么好的视频教程的。
其实一点儿也不稀奇。